سه شنبه, ۷ اسفند, ۱۴۰۳ / 25 February, 2025
مجله ویستا

جامعیت و مانعیت پنج موتور کاوش در بازیابی اطلاعات علمی در زمینه بیوتکنولوژی


جامعیت و مانعیت پنج موتور کاوش در بازیابی اطلاعات علمی در زمینه بیوتکنولوژی

هر عبارت جستجو در موتورهای کاوش منتخب وارد گردید نتایج نسبتاً زیادی بازیابی شد اما تنها ده نتیجه اول به منظور محدود کردن مطالعه به دلیل اینکه در واقع بیشتر کاربران معمولاً تحت ده نتیجه اول کلیدواژه جستجو, به جستجو می پردازند, مورد ارزیابی قرار گرفت

این مقاله، نتایج پژوهش اجرا شده در مورد پنج موتور کاوشAltavista, Google HotBot, Scirusو Bioweb را در بازیابی اطلاعات علمی با استفاده از عبارات جستجوی مرتبط با بیوتکنولوژی ارائه می دهد. این موتورهای کاوش بر اساس انتخاب ده نتیجه اول اطلاعات علمی بازیابی شده در حوزه بیوتکنولوژی، برای اندازه گیری مانعیت و جامعیت ارزیابی می شوند. نتایج نشان می دهد که Scirus جامع ترین موتور کاوش در بازیابی اطلاعات علمی و سپس Google و HotBot می باشند. نیز تحقیقات نشان می دهد که موتورهای کاوش مورد بررسی(به جزBioweb ) با زبان پرسش ساختار یافته خوب عمل می کنند در حالی که Bioweb در مورد پرسش های ساختار نیافته بهتر عمل می کند.

● مقدمه

وب به عنوان سریع ترین رسانه ارتباطات در حال رشد است. این تکنولوژی با تلفیق آخرین وسایل ذخیره سازی الکترونیکی، ما را قادر می سازد که از حجم عظیم اطلاعات موجود در جامعه اطلاعاتی آگاه باشیم. (شیلتینگ و نیلسن[۲]، ۱۹۹۶). در کمتر از ده سال، وب از یک سیستم دشوار (از نظر فهم) برای استفاده توسط اجتماع کوچکی از محققان به روش بالفعلی برای کسب اطلاعات برای ملیون ها فرد که بیشتر آنها هرگز به بحث بازیابی اطلاعات از پایگاه های اطلاعاتی برخورد نکرده اند و هیچ علاقه ای نیز به آن نداشته اند، توسعه یافته یافته است.(اپنهایم و دیگران[۳]، ۲۰۰۰)

کثرت موتورهای کاوش از موتورهای کاوش عمومی گرفته تا موضوعی خاص، کاشفان عمده منابع روی وب می باشند. این موتورهای کاوش، حجم عظیمی از اطلاعات را با سرعت مشخص جستجو می کنند اما مورد انتقاد فراوان برای بازیابی اطلاعات غیر علمی، بی ربط و تکراری بوده اند که این برمی گردد به پایگاه اطلاعاتی جامعشان که حاوی اطلاعاتی از درجات مختلف اهمیت مثل رسانه ها، بازاریابی، سرگرمی، تبلیغ و غیره می باشد. عمدتاً این موتورهای کاوش، اطلاعات را از منظر علمی بودن گزینش نمی کنند اگرچه بعضی از موتورهای کاوش نظیر Google فرم مجزایی را برای اشاعه اطلاعات علمی با عنوان “Google Scholar” توسعه داده است. (این ابزار بعد از شروع این پژوهش به Google ، ضمیمه شد). تعداد موتورهای کاوشی که اکنون قابل دسترس هستند، آنها را نیز به یک موضوع مهم و مورد علاقه برای پژوهش تبدیل کرده است.(کلارک و ویلت[۴]، ۱۹۹۷ ؛ مدی[۵]، ۱۹۹۶).

● پژوهش های مرتبط

رشد روزافزون پژوهش های ارزیابی موتورهای کاوش وب، ماهیتاً توصیفی است و انسجام کمی دارد. اسکوویل[۶](۱۹۹۶) میزان وسیعی از موتورهای کاوش وب را برای یافتن میزان ربط مدارک بازیابی شده توسط آنها، مورد بررسی قرار داد. ده نتیجه اول بازیابی شده، برای سنجش میزان دقت ارزیابی شد. نتایج این پژوهش نشان داد کهLycos, Infoseek و Excite نسبت به بقیه موتورهای کاوش برترند. لیتون[۷](۱۹۹۷) میزان مانعیت چهار موتور کاوش Infoseek, Lycos, WebCrawler و WWWWorm را با استفاده از هشت سوال مرجع ارزیابی کرد و Infoseek و Lycos را در رده بالاتر از لحاظ مانعیت قرار داد.

دینگ و مارکیونینی[۸](۱۹۹۶) سه موتور کاوش Infoseek, Lycos و Open Text را برای سنجش میزان مانعیت، بازیابی اطلاعات تکراری و درجه همپوشانی با استفاده از پنج پرسش پیچیده مورد ارزیابی قرار دادند. بیست نتیجه اول بازیابی شده برای سنجش مانعیت بررسی شد. بررسی ها نشان داد که بهترین نتایج از Lycos و Open Text کسب شد. لیتون و اسری واستاوا[۹](۱۹۹۷) پانزده کلید واژه را روی موتورهای کاوش Altavista, HotBot, Excite, Infoseek و Lycos جستجو کردند و بیست نتیجه اول بازیابی شده را برای ارزیابی مانعیت، مورد بررسی قرار دادند. چو و رزنتال[۱۰](۱۹۹۶) Altavista, Excite و Lycos را از لحاظ قابلیت های جستجو و نیز دقت آنها، مورد مقایسه قرار دادند. این محققان، ده عبارت جستجو با پیچیدگی های متفاوت از طریق ارزیابی میزان ربط ده نتیجه اول بازیابی شده، مورد بررسی قرار دادند و نشان دادند که Altavista نسبت بهExcite و Lycos هم در عمل بازیابی و هم قابلیت های جستجو، بهتر عمل کرد. کلارک و ویلت[۱۱](۱۹۹۷) سی کلیدواژه کاملاً متفاوت روی Altavista, Lycos و Excite مورد جستجو قرار دادند و بهترین نتایج را از نظر مانعیت، جامعیت و پوشش موضوعی از Altavista کسب کردند. بارایلان[۱۲](۱۹۹۸) شش موتور جستجو را با استفاده از کلیدواژه منفرد”Erdos” مورد بررسی قرار داد. بررسی تمام مدارک بازیابی شده که تعداد آن ۶۶۸۱ بود برای میزان مانعیت، همپوشانی و جامعیت نسبی، نشان داد که هیچ موتور کاوشی از جامعیت بالایی برخوردار نیست.

● اهداف پژوهش

اهداف این پژوهش در زیر ارائه می شوند که عبارتند از:

۱) شناسایی موتورهای کاوش برای بازیابی اطلاعات علمی در حوزه بیوتکنولوژی

۲) بررسی میزان جامعیت و مانعیت موتورهای کاوش منتخب

۳) شناخت تاثیر ماهیت و انواع عبارات جستجو بر روی مانعیت و جامعیت موتورهای کاوش منتخب

● روش پژوهش

این پژوهش در سه مرحله انجام شد: در مرحله اول، اطلاعات مرتبط موجود(قابل دسترس) به شکل چاپی و الکترونیکی برای مطالعه جمع آوری شد. در مرحله دوم موتورهای کاوش انتخاب شدند و متعاقباً عبارات جستجو بیرون کشیده شدند. در مرحله سوم موتورهای کاوش برای عبارات منتخب از ۲۵ مارس تا ۲۵ آوریل سال ۲۰۰۴ مورد بررسی قرار گرفتند. هر چند موتورهای کاوشAltavista و HotBot به دلیل اعمال تغییرات در سیاست الگوریتم بازیابی اطلاعاتشان مجدداً بررسی شدند. در پایان، داده ها برای به دست آوردن نتایج تجزیه و تحلیل شدند.

۱) موتورهای کاوش مورد مطالعه

موتورهای کاوشی که مورد بررسی قرار گرفتند عبارتند از:

▪ Altavista (عمومی)

▪ Google (عمومی)

▪ HotBot (عمومی)

▪ Scirus (در زمینه علوم و تکنولوژی)

▪ Bioweb (در زمینه بیوتکنولوژی)

۲) عبارات جستجوی نمونه

۲۰ عبارت جستجو از الگوی ۱۴۰ عبارت جستجو بیرون کشیده شد(انتخاب شد) که با کمک لیست سرعنوان های موضوعی کتابخانه کنگره(LCSH, ۲۰۰۳) گردآوری شده بود. این عبارات جستجو تحت سه گروه: عبارات ساده، ترکیبی، و اصطلاحات پیچیده(پیوست۱) برای بررسی اینکه چگونه موتورهای کاوش اصطلاحات عبارتی و ساده را مهار و کنترل می کنند[به کار گرفته شدند]. اصطلاحات ساده با همان ساختار طبیعی شان، عبارات ترکیبی همان طور که توسط موتورهای کاوش مربوطه پیشنهاد شده بودند و عبارات پیچیده با قرار دادن عملگرهای بولی مناسب AND و OR بین اصطلاحات، برای انجام دادن جستجوهای ویژه ارائه شدند. ۵ عبارت جستجوی مجزا برای هر یک از اصطلاحات بر اساس ساختار موتور کاوش منتخب، ساخته شد.

۳) جامعه پژوهش

موتورهای کاوش منتخب دو شیوه جستجو را ارائه می دهند: روش جستجوی ساده و جستجوی پیشرفته. این پژوهش روش جستجوی پیشرفته را در سراسر پژوهش انتخاب کرده است تا از قابلیت های موجود برای بهینه کردن و نیز نشان دادن تعداد دقیق نتایج استفاده کند. در مورد Altavista و Google “match all of the words” را برای اصطلاحات پیچیده و ساده و “Exact phrase” را برای کلیدواژه های ترکیبی انتخاب گردید. HotBot و Scirus این گزینه ها را از طریق منوهایPull down ارائه می دهند. هر جستجو با انتخاب فیلد عنوان( یعنی تمام کلمات در عنوان) و دوره محدود زمانی مدارک منتشر شده از سال ۲۰۰۴ تا ۲۰۰۵ انجام شد. تمام موتورهای کاوش(به استثنای Bioweb و Scirus ) برای بازیابی نتایج به زبان انگلیسی، تنظیم شدند. از سوی دیگر Bioweb گزینه های محدودکننده نسبتاً متفاوتی را ارائه داد که در بین آنها" ربط سپس تاریخ" و عملگر بولی مخفی OR” “ در طول فرآیند جستجو ترجیح داده شدند.

هر عبارت جستجو در موتورهای کاوش منتخب وارد گردید. نتایج نسبتاً زیادی بازیابی شد اما تنها ده نتیجه اول به منظور محدود کردن مطالعه به دلیل اینکه در واقع بیشتر کاربران معمولاً تحت ده نتیجه اول کلیدواژه جستجو، به جستجو می پردازند، مورد ارزیابی قرار گرفت. هر عبارت جستجو در هر پنج موتور کاوش در یک روز به منظور اجتناب کردن از تغییراتی که ممکن است به واسطه روزآمدسازی سیستم پیش بیاید، آزمایش شد(کلارک و ویلت، ۱۹۹۷). ده نتایج اول بازیابی شده برای هر عبارت جستجو به عنوان مدارک علمی و تقسیمات دیگر طبقه بندی شد.

نوشته: اس.ام.شافی(S.M.Shafi) و رفیق ا. رادر Rafiq A. Rather

ترجمه: صدیقه شاکری

کارشناس ارشد کتابداری و اطلاع رسانی دانشگاه آزاد اسلامی واحد علوم و تحقیقات

پانوشتها:

۱. این مقاله ترجمه‌ای است از:

Shafi, S. M. and Rather, Rafiq A.(۲۰۰۵) Precision and recall of five search engines for retrieval of scholarly information in the field of Biotechnology. Webology , Volume ۲, Number ۲, August, ۲۰۰۵. [Available at: http://www.webology.ir/۲۰۰۵/v۲n۲/a۱۲.html]

[۲] Schlichting & Nilsen

[۳] .Oppenheiem et al

[۴] . Clarke & Willet

[۵] . Modi

[۶] . Scoville

[۷] . Leighton

[۸] . Ding & Marchionini

[۹] . Leighton & Srivastava

[۱۰] . Chu & Rosenthal

[۱۱] . Clark & Willet

[۱۲] . Bar-Ilan

[۱۳] . Tague, ۱۹۹۲

منابع و مآخذ

Bar-Ilan, J. (۱۹۹۸). On the overlap, the precision and estimated recall of search engines: A case study of the query "Erdos". Scientometrics, ۴۲ (۲), ۲۰۷-۲۰۸.

Chu, H., & Rosenthal, M. (۱۹۹۶). Search engines for the World Wide Web: a comparative study and evaluation methodology. In: Proceedings of the ASIS ۱۹۹۶ Annual Conference, October, ۳۳, ۱۲۷-۳۵. Retrieved August ۱۹, ۲۰۰۳ from http://www.asis.org/annual-۹۶/ElectronicProceedings/chu.html

Clarke, S., & Willett, P. (۱۹۹۷). Estimating the recall performance of search engines. ASLIB Proceedings, ۴۹ (۷), ۱۸۴-۱۸۹.

Ding, W., & Marchionini, G. (۱۹۹۶). A comparative study of the Web search service performance. In: Proceedings of the ASIS ۱۹۹۶ Annual Conference, October, ۳۳, ۱۳۶-۱۴۲.

Leighton, H. (۱۹۹۶, June ۲۵). Performance of four WWW index services, Lycos, Infoseek, Webcrawler and WWW Worm. Retrieved June ۱۰, ۲۰۰۵ from http://www.winona.edu/library/webind.htm

Leighton, H., & Srivastava, J. (۱۹۹۷). Precision among WWW search services (search engines): AltaVista, Excite, HotBot, Infoseek and Lycos. Retrieved June ۱۱, ۲۰۰۵ from http://www.winona.edu/library/webind۲.htm

Library of Congress (۲۰۰۳). Library of Congress Subject Headings (vol.s ۱-۵). Washington: Library of Congress, Cataloging Distribution Service.

Modi, G. (۱۹۹۶). Searching the Web for gigabucks. New Scientist, ۱۵۰ (۲۰۲۴), ۳۶-۴۰.

Oppenheiem, C., Moris, A, Mcknight, C., & Lowley, S. (۲۰۰۰). The evaluation of WWW search engines. Journal of documentation, ۵۶ (۲), ۱۹۰-۲۱۱.

Schlichting, C., & Nilsen, E. (۱۹۹۶). Signal detection analysis of WWW search engines. Retrieved September ۱۵, ۲۰۰۳ from http://www.microsoft.com/usability/webconf/schlichting/schlichting.htm

Scoville, R. (۱۹۹۶). Find it on the Net. PC World, January, ۱۴(۱), ۱۲۵-۱۳۰. Retrieved June ۶, ۲۰۰۳ from http://www.pcworld.com/reprints/lycos.htm

Tague, J. (۱۹۹۲). The Pragmatics of information retrieval experimentation, revisited. Information retrieval experiment, ۱۴, ۵۹-۱۰۲. Retrieved ۱۱ June, ۲۰۰۵ from http://portal.acm.org/citation.cfm?id=۱۴۹۵۱۴

پیوست۱.پرسش های جستجوی نمونه(استفاده شده در پژوهش حاضر)

I. Antibiotics

II. Biogas

III. Brewing

IV. Cloning

V. Fermentation

VI. Gene

VII. "enzyme technology"

VIII. "gene therapy"

IX. "molecular Cloning"

X. "monoclonal antibiotics"

XI. "protozoa biotechnology"

XII. "recombinant DNA"

XII. "silage fermentation"

XIV. animal AND "genetic engineering"

XV +bacterial +starter +cultures

XVI. biotechnological AND "process control"

XVII. "genetically modified" OR "engineered foods"

XVIII. microbial AND "mutational breeding"

XIX. "recombinant DNA" AND research

XX. "yeast fungi" AND "genetic engineering"


شما در حال مطالعه صفحه 1 از یک مقاله 2 صفحه ای هستید. لطفا صفحات دیگر این مقاله را نیز مطالعه فرمایید.