شنبه, ۹ تیر, ۱۴۰۳ / 29 June, 2024
مجله ویستا

دقت موتورهای كاوش اینترنتی مطالعه ای موردی در ارتباط با علوم زمین


اطلاعات علوم زمین بصورت گسترده ای از طریق مؤسسات و شركتهای دولتی, ملی, منطقه ای و بین المللی و نیز منابع متعدد تجاری و شخصی بر روی اینترنت موجود می باشند برخی از مؤسسات نظیر سازمان زمین شناسی ایالات متحده و سازمان جهانی هواشناسی, سایت وب های خود را با ابزارهای جستجو برای یافتن اطلاعات در سایت, اداره می نمایند

مقدمه

اطلاعات علوم زمین بصورت گسترده‌ای از طریق مؤسسات و شركتهای دولتی، ملی، منطقه‌ای و بین‌المللی و نیز منابع متعدد تجاری و شخصی بر روی اینترنت موجود می‌باشند. برخی از مؤسسات نظیر سازمان زمین‌شناسی ایالات متحده و سازمان جهانی هواشناسی، سایت وب‌های خود را با ابزارهای جستجو برای یافتن اطلاعات در سایت، اداره می‌نمایند. بدین ترتیب به منظور آگاهی از اینكه جستجوگر یا گروه جستجو با چه كسی مشاركت دارد یا اینكه مؤسسات دربارهء چه موضوع ویژه‌ای تحقیق می‌كنند، استفاده از یك موتور كاوش ضروری می‌نماید. این مقاله نتایج پرسشهای نمونه مرتبط با علوم زمین را در ۳۷ موتور جستجوی مبتنی بر وب ارائه می‌نماید. اطلاعات بر مبنای اندازه بانك اطلاعاتی، دسترس‌پذیری اطلاعات علوم زمین و نیز ارزیابی دقت موتور كاوش بر مبنای سه نمونه پرسش، ارائه می‌گردد.بخش اول مقاله شرح مختصری از ساختار موتورهای كاوش را بدست می‌دهد. بخش دوم روش‌شناسی بكار رفته در ارزیابی موتورهای كاوش را ارائه می‌نماید. بخش سوم، نتایج حاصل از كاوشهای نمونه برای بررسی می‌نماید و شامل جدولی است كه اطلاعات ارزیابی شده را تنظیم می‌كند و راهكارهایی را كه می‌تواند در بدست آوردن اطلاعات علوم زمین هنگام استفاده از موتورهای كاوش اینترنتی مفید باشد، مورد بررسی قرار می‌دهد.

۱- ساختار موتور كاوش

موتورهای كاوش وبی همانند یك فهرست، جستجوگران را به یافتن اصطلاحات مورد كاوش هدایت می‌نمایند. به هر حال موتورهای جستجو مبتنی بر وب، واژه‌های موجود در متن یا پایگاه اطلاعاتی كنترل شده را نشان نمی‌دهند و بیشتر به رویدادهای اینترنتی اشاره دارند. به دلیل پیچیدگی فضای وب، مقایسه موتورهای كاوش كار دشواری است.

موتورهای كاوش در سه ردهء اصلی گسترش یافته‌اند. ردهء اول شامل موتورهای كاوش فهرستی یا راهنما۸ می‌باشد كه براساس موضوع یا نوع مدرك تنظیم شده‌اند. نمونه‌هایی از آنها عبارتند از:

یاهو! ۹ (یك فهرست مبتنی بر موضوع با یك وسیلهء كمكی كاوش كلیدواژه‌ای)، آرگوس كلیرینگهاوس (مجموعه‌ای از موتورهای جستجوی مبتنی بر موضوع)، دجانیوز۱۰ (یك موتور جستجوی اختصاص داده شده به اطلاعات یوزنت)، و ماژلان۱۱ (یك فهرست مبتنی بر موضوع از سایت وب‌های بازبینی شده).ردهء دوم عبارتند از: موتورهای جستجوی كلیدواژه‌ای یا روبات خزنده (نرم‌افزاری) ۱۲. این موتورها عناصر اینترنتی تهیه شده توسط برنامه‌های روباتی یا عنكبوتی را فهرست می‌نمایند. این برنامه‌ها مرتباً به منظور تأمین اطلاعات جدید و روزآمد، از طریق داده‌ها، پیوندها و متن صفحات وبی، هدایت می‌شوند. نمونه‌هایی از روبات‌های خزنده عبارتند از: هات بات۱۳، كه برنامه‌ای را بكار می‌برد كه صفحات وب را كلمه به كلمه فهرست می‌كند. اینفوسیك كه اطلاعات را از بین فرامین داده‌ها و پیوندها انتخاب می‌نماید.ردهء سوم موتورهای كاوش عبارتند از: موتورهای كاوش چندشاخه‌ای یا چند روباتی (متاكرولر) ۱۴، كه پایگاههای اطلاعاتی موتورهای كاوش متعددی را به طور همزمان جستجو می‌كند و نتایج تلفیقی را ارائه می‌نماید.

نمونه‌هایی از آن عبارتند از: متاكرولر۱۵ كه كلیدواژه‌ها را برای جستجوی شش فهرست بطور همزمان بكار می‌برد و آسك جیوز۱۶ كه پرسش‌های زبان طبیعی و یك سیستم تخصصی را برای جستجوی پنج موتور كاوش كلیدواژه‌ای بطور همزمان، بكار می‌برد.

در سه ردهء اصلی موتورهای كاوش، فناوریهای متقاطع وجود دارد. بعنوان مثال، برخی از موتورهای كاوش فهرستی یا راهنما دارای فهرستهای قابل جستجوی كلیدواژه‌ای و نیز درختهای موضوعی قابل مرور می‌باشند (نظیر: یاهو!، گالاكسی۱۷ و اینترنت اسلوث۱۸). همچنین برخی موتورهای كاوش كلیدواژه‌ای یا روبات خزنده، كانالهای موضوعی سلسله مراتبی به مدرك را در پایگاههای اطلاعاتی‌شان فراهم می‌كنند، مانند: اكسایت، لایكوس۱۹ و اینفوسیك.

به منظور بدست آوردن مناسبترین و دقیقترین نتایج، جستجوگران باید از برخی معیارهای مهم آگاه باشند. پیوندهای «كمكی»، «نحوهء جستجو» یا «درباره» روی صفحهء اصلی موتور كاوش به پاسخ دادن به این سؤالات كمك می‌نمایند:

۱- پایگاه اطلاعاتی چگونه ایجاد می‌شود؟ برخی موتورهای كاوش برای ثبت سایتهای خود به طراحان صفحهء وب متكی هستند، و برخی دیگر برای اطلاعات متمركز و روزآمد به بخشهای خزندهء وب، وابسته می‌باشند. در مقابل روبات خزنده تنها دستورات و فراپیوندها را جستجو نموده یا اصولاً متن صفحات را مرور می‌نماید.

۲- بزرگی پایگاه اطلاعاتی چقدر است؟ اندازهء پایگاه اطلاعاتی در بازیابی و دقت یك جستجو، مؤثر خواهد بود. برخی موتورهای كاوش نظیر یاهو و بیشتر سایتهای فهرستی، تنها صفحات اصلی اولیه را منظور می‌كنند، اما در عمل صفحات بیشتری را فهرست می‌نمایند. موتورهای دیگر هر صفحه را منظور می‌نمایند.

۳- پایگاه اطلاعاتی چقدر به روز است؟ و هر چند وقت یك بار روزآمد می‌شود؟ برنامه‌ریزان، روباتهای خزنده‌ای را طراحی نموده‌اند كه بصورت خودكار طبق یك برنامهء منظم كار می‌نماید. فاصلهء زمانی بین افزایش اطلاعات جدید و ورود آن به موتور كاوش حائز اهمیت است، خصوصاً اگر موضوع جستجو بسیار روزآمد باشد.

۴- چه عوامل جستجویی، موتور را حمایت می‌نمایند؟ برخی، امكانات جستجوی پیچیده از قبیل منطق بولی، جستجوی عبارتی و تقریب را پیشنهاد می‌نمایند، در حالیكه برخی دیگر چنین نمی‌كنند. یكی از مشكلات اصلی در استفاده از موتورهای كاوش مبتنی بر وب، ناتوانی در جستجوی فیلدهایی نظیر نویسنده یا عنوان می‌باشد، ضمناً برخی موتورهای كاوش به جستجوگران امكان تلفیق مجموعه نتایج را نمی‌دهد.

۵- نتایج جستجو چگونه مرتب شده و نمایش داده می‌شود؟ برخی موتورها نظیر اكسایت كه جستجوی مبتنی بر مفهوم را به كار می‌برند، نتایج جستجو را نه تنها برای واژه‌های مشخص بلكه برای مفاهیم مربوطه نیز ارائه می‌نمایند. برخی موتورها مانند هات بات نتایج را برمبنای تعداد دفعات موجود بودن واژه مورد جستجو روی یك صفحه ارائه می‌نمایند. برخی موتورهای كاوش تنها فراپیوندهای نتایج مرتب شده را فهرست می‌نمایند. نتایجی كه دیگر موتورهای كاوش ارائه می‌نمایند عبارتند از: چكیده یا شرح مختصر، اندازهء صفحه، پیوندهای مرتبط، نتایج فهرست‌نویسی، معرفی یا اطلاعات مربوط به نویسنده.

اگرچه یك زبان فرمان مشترك برای گسترش ارتباط وجود دارد، لكن هنوز تفاوتهای زیادی به چشم می‌خورد. برای كنترل بیشتر اطلاع‌یابی و نتایج حاصله، جستجوگران باید حداكثر استفاده را از امكانات جستجوی «قوی»۲۰ یا «پیشرفته»۲۱ موتورهای مختلف را بنمایند. سه نمونه سایت وب كه مقایسه‌های جالبی بین موتورهای كاوش اصلی انجام می‌دهند عبارتند از: وب ماتریكس۲۲ تهیه شده توسط‌«مات اسلات»

http://janus.ambrosiasw.com/~fprefect/matrix/

[Note:Link moved; URL changed ۴/۲/۰۲ by ald]

موتورهای كاوش واچ وب سایت۲۳

( http://searchenginewatch.com /)

و موتورهای كاوش :C۶۱۶۷۹;Net’s كه هرچیز را بر روی شبكه جستجو می‌نمایند (تهیه شده توسط آندره جی. لئونارد)

http://www.cnet.com/Content/Reviews/Compare/Search/index.hml )

[Note: Broken link removed ۸/۵/۹۸ by ald]

این سایت وب‌ها دارای جداولی می‌باشند كه در آنها توانائی‌ها، اندازه و رواج موتورهای كاوش اصلی با یكدیگر مقایسه می‌گردد. برای فهرستهای كامل موتورهای كاوش، از سایت وب مؤسسه فناوری حرفه‌ای دانشگاه كارولینای شمالی

( http://www.it.unc.edu/guides/irg-۰۸.html )

[Note: Broken link removed ۳/۴/۰۱ by ald]

و نیز فهرست موتورهای كاوش یاهو بازدید كنید.

http://dir/yahoo.com/computers_and_internet/internet/world_wide_web/searching_the_web/ ).

[Note: Link moved;URL changed ۷/۲۴/۰۰ by ald]

۲- روش‌شناسی

فهرستی از موتورهای كاوش مورد بررسی در جدول شمارهء ۱ آورده شده است. در این جدول نام، نشانی اینترنتی، اندازهء پایگاه اطلاعاتی هر موتور و توضیحات كاربر ارائه شده است. ضمناً یك ارزیابی ازدقت موتور جستجو بر مبنای سه نوع جستجوی نمونه نیز، در آن آمده است. سه نمونه پرسش بكار رفته در این تحقیق عبارتند از:

۱) ENSO (نوسان جنوبی EI Ni ?o)

۲) زون گسله مادرید جدید

۳) تولید مس در برزیل

حجم جستجو در این مطالعه، در مقایسه با دیگر مطالعات دقت موتور كاوش (لیتون و اسری و استاوا، ۱۹۹۷) و (تومائیولو و پاكر، ۱۹۹۶)، كم است، لكن با توجه به تأكید بر موضوعات مرتبط با علوم زمین، حائز اهمیت است. برای بررسی نتایج موتور كاوش، پرسش‌های نمونه، بر مبنای پرسش‌های كلیدواژه‌ای، عبارتی و چند مفهومی انتخاب شده است. جستجوهای ساده‌ای كه شكل تعریف نشده‌ای از ابزارهای مورد ارزیابی را ارائه می‌دهند. این بدان علت انجام می‌گیرد كه راهكارهای جستجوی ابزاری نسبت به راهكارهای جستجوگر، بیشتر مورد استفاده می‌باشد. موتورهای كاوش انتخاب شده برای این مطالعه، از فهرست موتورهای كاوش در سایت‌های مختلف انتخاب شده‌اند از قبیل:

Search Engine Watch

( http://searchenginewatch.com/ )

مقاله ۱۹۹۶ وبستر و پاول «ابزارها و فنون جستجوی وب»،

( http://magi.com/~mmelick/it۹۶jan.htm )

و فهرست ابزارهای جستجوی اینترنتی در كتابخانه دانشگاهی شمال غربی

( http://www.library.nwu.edu/resources/internet/search/ )

و مؤسسه فن‌آوری حرفه‌ای دانشگاه كارولینای شمالی

[ald; Broken link removed ۴/۲/۰۲].

دقت برای سنجش سودمندی موتورهای كاوش بكار رفته است كه بر مبنای نسبت تعداد ركوردهای مربوط در ۱۰ تا ۱۵ ركورد اول بازیابی شده، می‌باشد. این نسبت به سه درجه تقسیم می‌گردد: زیاد، متوسط، كم. موتورهای كاوشی كه پیوندهای فعال مرتبط با اطلاعات مربوط به پرسش‌های نمونه را ارائه می‌دهند، دارای درجه دقت زیاد می‌باشند، به موتورهای كاوشی كه پیوندهای حاشیه‌ای ارائه می‌نمایند (نظیر اطلاعات مس در كشورهای دیگر)، یك درجه دقت متوسط داده شده است. موتورهای كاوشی كه تعداد بسیار زیادی پیوندهای كاملاً غیرمرتبط و غیرفعال (نظیر محسوب كردن ENSO بعنوان نام یك شركت به جای یك پدیدهء هواشناختی یا پیوندهای حاوی اطلاعاتی در مورد مادرید، اسپانیا) را در ۱۰ تا ۱۵ ركورد اول ارائه می‌نمایند، دارای درجه دقت ضعیف می‌باشند. میزان دقت ارائه شده در جداول، بیش از آن كه یك معیار واقعی آماری نسبت باشد، تفسیری از نتایج به شمار می‌آید. این مطالعه یك نوع ارزیابی آماری از دقت نتایج موتورهای كاوش نیست بلكه عبارت از یك كاوش تفسیری ابزارها و سودمندی آنها در علوم زمین می‌باشد.در صورتی كه اطلاعات حاصل از نتایج یكدست بوده و داده‌های حقیقی را بدست دهد و بتواند در یك فعالیت مرجع بكار رود، آنگاه نتایج حاصله مناسب و مرتبط خواهد بود.


شما در حال مطالعه صفحه 1 از یک مقاله 4 صفحه ای هستید. لطفا صفحات دیگر این مقاله را نیز مطالعه فرمایید.