کاربرد موتورهای جستجو در پایگاههای اینترنتی نسخ خطی
موتورهای جستجو یکی از اصلیترین ابزارهای بازیابی در پایگاههای نسخ خطی هستند و شاید بتوان کیفیت خدماتی را که پایگاه ارائه می کند، براساس کیفیت خدمات موتورهای جستجو تفسیر کرد. در حقیقت موفقیت در جستجو و بازیابی بهتر اطلاعات ارتباطی مستقیم با رضایت کاربر از کل پایگاه اینترنتی دارد. سایر عناصر تشکیلدهندۀ پایگاه اینترنتی، از جمله گراف کلی سایت، چیدمان صفحات، طراحی گرافیک و توجه به راحتی کاربر در زمان استفاده از اپلیکشنهای گوناگون، نیز در میزان رضایت کاربر از سایت اینترنتی نقشی تعیین کننده دارند، اما تأکید مقالۀ حاضر بر اهمیت موتورهای جستجو از این نکته ناشی میشود که هدف اصلی کاربر از مراجعه به یک پایگاه اینترنتی، یافتن اطلاعاتی دربارۀ مادۀ آرشیوی موردنظرش است.
مزایا
سرعت و سهولت دسترسی دو عامل تعیینکنندۀ در روند بازیابی اطلاعات در یک پایگاه داده به شمار می آیند. 1 به بیان دیگر در این ارزیابی، فارغ از نوع اطلاعاتی که جستجو میکنیم، در پی یافتن پاسخی برای دو پرسش زیر هستیم:
• در چه مدت زمانی میتوان به اطلاعات مورد نظر دست یافت؟
• آیا ابزار بازیابی کاربر را مستقیماً به اطلاعات موردنظرش راهنمایی میکند و یا پس از استفاده از آن مجدداً کاربر ملزم به وجین کردن نتایج خواهد بود؟
با توجه به این دو شاخص شاید بتوان موتورهای جستجو را نسبت به دو شیوۀ دیگر بازیابی (درختوارۀ موضوعی و نظم الفبایی) ارحج دانست. زیرا از یک سو، بکارگیری دو شیوۀ مذکور آشکارا زمانبر خواهد بود و از سوی دیگر کاربر پیش از اقدام به استفاده از درخت موضوعی و نظم الفبایی، باید تصور دقیقی از تقسیمبندی موضوعی مورد نظر طراح پایگاه و یا عنوان اصلی مادۀ آرشیوی مورد نظر خود داشته باشد. اما یک موتور جستجو میتواند در کسری از ثانیه، اطلاعات مورد نظر را بیابد و با ورود یک کلیدواژه موثر، امکان دسترسی بیواسطۀ کاربر به اطلاعات مادۀ آرشیوی وجود دارد. در حقیقت به شرط استفاده از فناوری متناسب با حجم اطلاعات پایگاه، یک موتور جستجو بهترین ابزار بازیابی اطلاعات خواهد بود.
معایب
معایب موتورهای جستجوی پایگاههای اینترنتی نسخ خطی اسلامی را میتوان در دو گروه کلی دستهبندی کرد:
• معایب ناشی از خصوصیات فنی و ساختاری موتور جستجو
• معایب ناشی از عدم تطابق موتور جستجو با فهرستهای نسخ خطی اسلامی
در حقیقت، برخی از این معایب ناشی از ویژگیهای فنی و ساختاری موتورهای جستجو و برخی دیگر ناشی از عدم تناسب انواع موجود موتورهای جستجو با پایگاههای اینترنتی نسخ خطی اسلامی است.
بیشتر معایبی که در دستۀ اول جای میگیرند، به ساختار الگوریتم جستجوی بکار رفته در برنامهنویسی موتور جستجو باز میگردد. اغلب الگوریتمهای بکار رفته در این موتورها به شکلی ساده طراحی شدهاند و صرفاً از تکنیک مقایسۀ داده ورودی کاربر با دادههای موجود در بانک بهره میبرند. اگر چه این تکنیک جانمایۀ اصلی الگوریتم را تشکیل میدهد بدون در نظر گرفتن سایر پیشامدها و شیوههای متفاوت نحوۀ ورود اطلاعات توسط کاربر، بازده چندانی نخواهد داشت و شایان ذکر است که موفقیت اغلب موتورهای جستجوی عمومی از قبیل Google، Ask و Yahoo به توجهی که نسبت به این موارد نشان میدهند، بستگی دارد.
موتورهای جستجو یکی از اصلیترین ابزارهای بازیابی در پایگاههای نسخ خطی هستند و شاید بتوان کیفیت خدماتی را که پایگاه ارائه می کند، براساس کیفیت خدمات موتورهای جستجو تفسیر کرد. در حقیقت موفقیت در جستجو و بازیابی بهتر اطلاعات ارتباطی مستقیم با رضایت کاربر از کل پایگاه اینترنتی دارد. سایر عناصر تشکیلدهندۀ پایگاه اینترنتی، از جمله گراف کلی سایت، چیدمان صفحات، طراحی گرافیک و توجه به راحتی کاربر در زمان استفاده از اپلیکشنهای گوناگون، نیز در میزان رضایت کاربر از سایت اینترنتی نقشی تعیین کننده دارند، اما تأکید مقالۀ حاضر بر اهمیت موتورهای جستجو از این نکته ناشی میشود که هدف اصلی کاربر از مراجعه به یک پایگاه اینترنتی، یافتن اطلاعاتی دربارۀ مادۀ آرشیوی موردنظرش است.
مزایا
سرعت و سهولت دسترسی دو عامل تعیینکنندۀ در روند بازیابی اطلاعات در یک پایگاه داده به شمار می آیند. 1
Amit Singhal (2001), Modern Information Retrieval: A Brief Overview, Bulletin of the IEEE Computer Society Technical Committee on Data Engineering 24 (4): 35–43.
• در چه مدت زمانی میتوان به اطلاعات مورد نظر دست یافت؟
• آیا ابزار بازیابی کاربر را مستقیماً به اطلاعات موردنظرش راهنمایی میکند و یا پس از استفاده از آن مجدداً کاربر ملزم به وجین کردن نتایج خواهد بود؟
با توجه به این دو شاخص شاید بتوان موتورهای جستجو را نسبت به دو شیوۀ دیگر بازیابی (درختوارۀ موضوعی و نظم الفبایی) ارحج دانست. زیرا از یک سو، بکارگیری دو شیوۀ مذکور آشکارا زمانبر خواهد بود و از سوی دیگر کاربر پیش از اقدام به استفاده از درخت موضوعی و نظم الفبایی، باید تصور دقیقی از تقسیمبندی موضوعی مورد نظر طراح پایگاه و یا عنوان اصلی مادۀ آرشیوی مورد نظر خود داشته باشد. اما یک موتور جستجو میتواند در کسری از ثانیه، اطلاعات مورد نظر را بیابد و با ورود یک کلیدواژه موثر، امکان دسترسی بیواسطۀ کاربر به اطلاعات مادۀ آرشیوی وجود دارد. در حقیقت به شرط استفاده از فناوری متناسب با حجم اطلاعات پایگاه، یک موتور جستجو بهترین ابزار بازیابی اطلاعات خواهد بود.
معایب
معایب موتورهای جستجوی پایگاههای اینترنتی نسخ خطی اسلامی را میتوان در دو گروه کلی دستهبندی کرد:
• معایب ناشی از خصوصیات فنی و ساختاری موتور جستجو
• معایب ناشی از عدم تطابق موتور جستجو با فهرستهای نسخ خطی اسلامی
در حقیقت، برخی از این معایب ناشی از ویژگیهای فنی و ساختاری موتورهای جستجو و برخی دیگر ناشی از عدم تناسب انواع موجود موتورهای جستجو با پایگاههای اینترنتی نسخ خطی اسلامی است.
بیشتر معایبی که در دستۀ اول جای میگیرند، به ساختار الگوریتم جستجوی بکار رفته در برنامهنویسی موتور جستجو باز میگردد. اغلب الگوریتمهای بکار رفته در این موتورها به شکلی ساده طراحی شدهاند و صرفاً از تکنیک مقایسۀ داده ورودی کاربر با دادههای موجود در بانک بهره میبرند. اگر چه این تکنیک جانمایۀ اصلی الگوریتم را تشکیل میدهد بدون در نظر گرفتن سایر پیشامدها و شیوههای متفاوت نحوۀ ورود اطلاعات توسط کاربر، بازده چندانی نخواهد داشت و شایان ذکر است که موفقیت اغلب موتورهای جستجوی عمومی از قبیل Google، Ask و Yahoo به توجهی که نسبت به این موارد نشان میدهند، بستگی دارد.
- Amit Singhal (2001), Modern Information Retrieval: A Brief Overview, Bulletin of the IEEE Computer Society Technical Committee on Data Engineering 24 (4): 35–43.
دوشنبه ۲۱ شهريور ۱۴۰۱ ساعت ۱۱:۵۰