کاربرد موتورهای جستجو در پایگاه‌های اینترنتی نسخ خطی

موتورهای جستجو یکی از اصلی‌ترین ابزارهای بازیابی در پایگاه‌های نسخ خطی هستند و شاید بتوان کیفیت خدماتی را که پایگاه ارائه می کند، براساس کیفیت خدمات موتورهای جستجو تفسیر کرد. در حقیقت موفقیت در جستجو و بازیابی بهتر اطلاعات ارتباطی مستقیم با رضایت کاربر از کل پایگاه اینترنتی دارد. سایر عناصر تشکیل‌دهندۀ پایگاه اینترنتی، از جمله گراف کلی سایت، چیدمان صفحات، طراحی گرافیک و توجه به راحتی کاربر در زمان استفاده از اپلیکشن‌های گوناگون، نیز در میزان رضایت کاربر از سایت اینترنتی نقشی تعیین کننده دارند، اما تأکید مقالۀ حاضر بر اهمیت موتورهای جستجو از این نکته ناشی می‌شود که هدف اصلی کاربر از مراجعه به یک پایگاه اینترنتی، یافتن اطلاعاتی دربارۀ مادۀ آرشیوی موردنظرش است.

مزایا
سرعت و سهولت دسترسی دو عامل تعیین‌کنندۀ در روند بازیابی اطلاعات در یک پایگاه داده به شمار می آیند. 1 Amit Singhal (2001), Modern Information Retrieval: A Brief Overview, Bulletin of the IEEE Computer Society Technical Committee on Data Engineering 24 (4): 35–43. به بیان دیگر در این ارزیابی، فارغ از نوع اطلاعاتی که جستجو می‌کنیم، در پی یافتن پاسخی برای دو پرسش زیر هستیم:
• در چه مدت زمانی می‌توان به اطلاعات مورد نظر دست یافت؟
• آیا ابزار بازیابی کاربر را مستقیماً به اطلاعات موردنظرش راهنمایی می‌کند و یا پس از استفاده از آن مجدداً کاربر ملزم به وجین کردن نتایج خواهد بود؟
با توجه به این دو شاخص شاید بتوان موتورهای جستجو را نسبت به دو شیوۀ دیگر بازیابی (درختوارۀ موضوعی و نظم الفبایی) ارحج دانست. زیرا از یک سو، بکارگیری دو شیوۀ مذکور آشکارا زمان‌بر خواهد بود و از سوی دیگر کاربر پیش از اقدام به استفاده از درخت موضوعی و نظم الفبایی، باید تصور دقیقی از تقسیم‌بندی موضوعی مورد نظر طراح پایگاه و یا عنوان اصلی مادۀ آرشیوی مورد نظر خود داشته باشد. اما یک موتور جستجو می‌تواند در کسری از ثانیه، اطلاعات مورد نظر را بیابد و با ورود یک کلیدواژه موثر، امکان دسترسی بی‌واسطۀ کاربر به اطلاعات مادۀ آرشیوی وجود دارد. در حقیقت به شرط استفاده از فناوری متناسب با حجم اطلاعات پایگاه، یک موتور جستجو بهترین ابزار بازیابی اطلاعات خواهد بود.

معایب
معایب موتورهای جستجوی پایگاه‌های اینترنتی نسخ خطی اسلامی را می‌توان در دو گروه کلی دسته‌بندی کرد:
• معایب ناشی از خصوصیات فنی و ساختاری موتور جستجو
• معایب ناشی از عدم تطابق موتور جستجو با فهرست‌های نسخ خطی اسلامی
در حقیقت، برخی از این معایب ناشی از ویژگی‌های فنی و ساختاری موتورهای جستجو و برخی دیگر ناشی از عدم تناسب انواع موجود موتورهای جستجو با پایگاه‌های اینترنتی نسخ خطی اسلامی است.
بیشتر معایبی که در دستۀ اول جای می‌گیرند، به ساختار الگوریتم جستجوی بکار رفته در برنامه‌نویسی موتور جستجو باز می‌گردد. اغلب الگوریتم‌های بکار رفته در این موتورها به شکلی ساده طراحی شده‌اند و صرفاً از تکنیک مقایسۀ داده ورودی کاربر با داده‌های موجود در بانک بهره می‌برند. اگر چه این تکنیک جان‌مایۀ اصلی الگوریتم را تشکیل می‌دهد بدون در نظر گرفتن سایر پیشامدها و شیوه‌های متفاوت نحوۀ ورود اطلاعات توسط کاربر، بازده چندانی نخواهد داشت و شایان ذکر است که موفقیت اغلب موتورهای جستجوی عمومی از قبیل Google، Ask و Yahoo به توجهی که نسبت به این موارد نشان می‌دهند، بستگی دارد.

۱. Amit Singhal (۲۰۰۱), Modern Information Retrieval: A Brief Overview, Bulletin of the IEEE Computer Society Technical Committee on Data Engineering ۲۴ (۴): ۳۵–۴۳.
دوشنبه ۲۱ شهريور ۱۴۰۱ ساعت ۱۱:۵۰