پنجشنبه, ۱۳ اردیبهشت, ۱۴۰۳ / 2 May, 2024
مجله ویستا

فراپیوندها و نقش آنها در بازیابی اطلاعات در محیط وب


فراپیوندها و نقش آنها در بازیابی اطلاعات در محیط وب
فراپیوندها یکی از اجزای اصلی صفحه‌های وب هستند که توسط موتورهای کاوش در فرایند نمای هسازی و رتبه‌بندی صفحه‌های وب مورد استفاده قرار میگیرند. این مقاله به بررسی انواع فراپیوندها و اهمیت آنها در نمایه‌سازی، ذخیره‌سازی و بازیابی اطلاعات در محیط وب میپردازد.
● مقدمه
یک صفحه وب، عموماً شامل عناصری از قبیل متن، فراپیوند۲، تصاور و ... است. فراپیوند ارتباط بین دو صفحۀ وب یا تنها بین قسمتهایی از یک صفحه را مشخص میکند. شناخت ساختار فراپیوند پایۀ شناخت ساختار ارتباطی وب است، زیرا فراپیوندها در نمایه‌سازی، بازیابی اطلاعات و رتبه‌بندی صفحه‌های وب مورد استفاده قرار میگیرند. اگر وب یک اتومبیل باشد، فراپیوندها موتور آن خواهند بود، زیرا بدون آنها به هیچ جا نمیتوان رفت.
● انواع فراپیوندها
به طور کلی، در محیط وب سه نوع فراپیوند وجود دارد:
۱) پیوند جاینما۳:
پیوند به صفحه‌های دیگر در یک وبگاه۴ که صفحه‌های داخل وبگاه را به هم مرتبط میکنند. مانند: "بازگشت به صفحه نخست"، "بازگشت به صفحه اصلی"، "صفحه قبل" و غیره. پیوند جای‌نما برای سهولت جایابی در وب‌گاهها به وسیلۀ کاربران نهایی، یک نیاز بنیادی است. همچنین برای نمایه‌سازی وبگاه‌ها به وسیلۀ ربات‌های موتورهای جستجو ضروری میباشد.
۲) پیوند دریافتی۵ (درونی):
پیوندهایی داده شده به یک وبگاه از سوی وبگاههای دیگر، پیوند دریافتی یا پیوند درونی خوانده میشوند. موتورهای جستجو از پیوندهای دریافتی برای نمایه‌سازی صفحه‌های وب قابل نمایه‌سازی به منظور اضافه شدن به پایگاه اطلاعاتی آنها، سنجش ربط و بیربطی منابع بازیابی شده در جواب پرسش کاربران و رتبه‌بندی منابع، استفاده میکنند. پیوندهای دریافتی مهمتر از پیوندهای جاینما هستند. ایجاد کردن یک پیوند دریافتی به یک صفحه وب، نشاندهنده قضاوت فرد ایجاد کننده آن است، بدین شکل که سازندۀ صفحۀ الف، با ایجاد یک پیوند دریافتی به صفحۀ ب ، تا اندازه‌ای به صفحه ب اعتبار داده است و "قضاوت پنهان افراد" را نشان میدهد (کلاینبرگ، ۱۹۹۹). برای مثال، نظام رتبه‌بندی صفحه‌های وب در موتور جستجو گوگل تا حد زیادی مبتنی بر پیوندهای دریافتی است.
۳) پیوند به آدرس پست الکترونیکی (رایانامه) افراد.
از نقطه نظر موتورهای جستجوی پیوند–محور، سه نوع فراپیوند وجود دارد (نگاه شود به شکل ۱).
یک پیوند متنی شامل یک آدرس جای‌نمای جهانی منبع۷ و گروهی از کلمات است که به عنوان متن پیوند شناخته میشوند.
در زیر مثالی از یک پیوند متنی ساده آورده شده است:
<a href=http://mail.yahoo.com/config/login?/"http://www.ABC.com">underlined anchor text</a>
روباتهای موتورهای جستجو سادگی پیوندهای متنی را به هر نوع دیگر پیوند ترجیح میدهند. در واقع، متن پیوند از نظر موتورهای جستجو بسیار حائز اهمیت است و در محاسبۀ رتبهبندی صفحه‌های وب توسط موتورهای جستجو در مقایسه با بدنۀ عادی متن به آن اهمیت بیشتری داده میشود. دلیلی که موتورهای جستجو به متن پیوند اهمیت بیشتری میدهند، این است که موتورهای جستجو بر این فرض استوار هستند که نویسندۀ یک صفحه وب تنها به صفحه‌هایی پیوند میدهد که از نظر وی مهم هستند. اگر وی یک صفحه وب را مهم بداند، به طبع موتورهای جستجو هم آن را مهم میپندارد. به همین دلیل نویسندگان وب میدانند که باید به صفحه‌های مهم پیوند دهند و باید از کلیدواژه‌های مناسب در متن پیوند استفاده کنند. ایدۀ ارتباط متن پیوند با صفحهای که متن به آن اشاره دارد نخستینبار توسط یکی از موتورهای جستجو معروف به "خزنده وب جهانگستر۸ " استفاده شد (مکبرایان، ۱۹۹۴) که بعدها به وسیله سایر موتورهای جستجو به کار گرفته شد.
روبات موتورهای جستجو نمیتوانند نوشته‌های گرافیکی را بخوانند و اگر حالت گرافیکی در واقع نمایش تصویری یک کلمه باشد، مانند "درباره ما" (About Us) آنگاه یک موتور جستجو چگونه میتواند آن را تشخیص دهد؟ در تمام مواردی که از گرافیک استفاده میشود، معقول است که از برچسب متن برابر۹ (ALT) همراه با کد منبع تصویر استفاده شود. به عنوان مثال، متن برابر برای مثال بالا به شکل زیر است:
<a href=http://mail.yahoo.com/config/login?/"http://www.ABC.com/aboutus.html"><img src=http://mail.yahoo.com/config/login?/"/aboutus.jpg" alt="Short Text Explaining Where the Graphic Link will Take Visitor"></a>
برچسب ALT به جای متن پیوند، موتورهای جستجو را قادر میسازد تا مثل خوانندگان صفحه، به گرافیکها معنا دهند. بنابراین، هنگام ایجاد پیوند به صفحه‌های وب استفاده از کلیدواژه های خاص در برچسب ALT بسیار مهم است (شوارتز، ۲۰۰۳).
بنابراین، زمینه پیوند، جنبه مهمی برای تحلیل پیوندهاست. زمینه پیوند نشان میدهد که یک پیوند که بر روی یک صفحه وب ظاهر میشود تا چه اندازه با کلیدواژه های متن صفحه‌های که به آن پیوند داده شده است مرتبط است. به نظر میرسد که موتورهای جستجو به یک وبگاه با محتوا در مقایسه با وبگاهی که از لحاظ محتوایی چیزی ندارد بلکه صرفاً صفحه‌های درگاهی۱۰ خوبی دارد، بیشتر ارزش میدهند (وارد، ۲۰۰۱). تمام پیوندها به طور مشابه و برابر ساخته نشدهاند، بلکه برخی نسبت به بقیه مهمتر هستند. مفهوم ساده است.
پیوندهای گرافیکی و وابستگی، به‌طور کلی برای بازاربابی و تجارت هستند. اینگونه پیوندها میتوانند "خریداری" شوند، بنابراین موتورهای جستجو به آنها ارزشی نمیدهند. اما یک پیوند متنی نیاز به یک نویسندۀ وب برای بررسی و کنترل وبگاه مورد نظر و سپس ساخت یک فراپیوند دارد. این برای همه مشهود است. بدین معنی که نویسندۀ وب به موضوع و کیفیت صفحه وب یا وبگاه مورد نظر از طریق فراپیوند اعتبار میدهد. هنگامی که متن یک پیوند، بدنه یا عنوان پیوند شامل کلیدواژه‌ها باشند، پیوند ارزش بیشتری دارد و رتبه صفحه دریافتکننده پیوند را در موتورهای جستجو بالا میبرد. مثالی از یک پیوند متنی حاوی کلیدواژه‌ها در عنوان پیوند به صورت زیر است:
<a href=http://mail.yahoo.com/config/login?/"http://www.IFLA.org/" title="International Federation of Library Associations and Institutions (IFLA)">IFLA</a>
برای توضیح کامل و جامع پیوندهای متنی، باید به روزهای اول وب برگشت. وب در ابتدا با فراهمآوری اطلاعات در صفحه‌های وب ایجاد شده به زبان نشانهگذاری فرامتن۱۱ و با تصاویر گرافیکی بسیار کم شروع به کار کرد. هنگامی که صفحه‌های وب اولیه میخواستند به سایر منابع اطلاعاتی که با موضوع آنها مرتبط بودند ارجاع دهند، پیوندهای متنی ایجاد میکردند. از این رو وب بر پایۀ پیوندهای متنی ساخته شد. بیشترین اهمیت پیوندهای متنی، هنگامی است که به یک منبع وب اشاره دارند. بنابراین، پیوندهای متنی برای ترقی دادن یک وبگاه حائز اهمیت هستند، زیرا پیوندها:
یک پیوند مستقیم مبتنی بر متن پیوند ساخته شده با کلیدواژهها و یا عنوان، به منظور تسهیل فرایند بازدید از وبگاه توسط بازدیدکنندگان فراهم میکنند و رفت و برگشت را بدون تغییر مسیر مجدد سرور میسر میسازند.
به عنوان یک رأی یا فزایندۀ اعتبار و عمومیت وبگاهها خدمت میکنند که تمام موتورهای جستجوی عمده مانند گوگل، هنگام رتبهبندی صفحه‌های وب مرتبط با یک جستجو انجام شده توسط کاربری که به دنبال واژهها یا عبارتهای مرتبط با یک وبگاه یا صفحه وب است از آن استفاده میکنند. "گوگل یک پیوند ایجاد شده در صفحۀ الف به صفحۀ ب را به عنوان یک رأی از جانب صفحۀ الف برای صفحۀ ب تفسیر میکند. اما گوگل چیزهای دیگری غیر از حجم صرف رأیها و یا پیوندهایی که یک صفحه وب دریافت میکند، مورد توجه قرار میدهد. گوگل حتی صفحهای که رأی را مطرح کرده است را نیز تحلیل مینماید. رأیهای داده شده از جانب صفحه‌هایی که خود از اهمیت زیادی برخوردارند، حائز اهمیت بیشتری هستند و به صفحه‌های دیگر کمک میکنند تا حائز اهمیت گردند." (گوگل، ۲۰۰۵).
موتورهای جستجوی مختلف از الگوریتمهای رتبهبندی گوناگونی استفاده میکنند و شکل واقعی آنها به صورت یک راز نگه داشته میشود. اما گوگل پروانه ثبت اختراعی با عنوان "بازیابی اطلاعات بر پایه دادههای گذشتهنگر" در ۳۱ مارس ۲۰۰۵ تکمیل کرد که تا حد زیادی نحوه رتبهبندی وبگاهها و صفحه‌های وب را آشکار نمود. انتشار این پروانه ثبت که حاوی ۶۳ بند بود، تعداد زیادی از ضوابط و ملاکهای رتبهبندی را فاش کرد. این پروانه ثبت شیوهای را ادعا میکند که شامل "مشخص کردن تاریخ آغاز یک مدرک، و رتبه بندی مدرک (حداقل تا حدودی) بر پایه میزان پیوندهایی دریافتی از سایر وبگاهها، تاریخ ایجاد پیوند به آن مدرک، تاریخ تغییر پیوندها به آن مدرک، تاریخ ایجاد یک پیوند متنی به آن مدرک، تاریخ ایجاد صفحه حاوی پیوند به آن مدرک، و تاریخ تغییرات ایجاد شده در صفحهای که به آن مدرک پیوند داده است" میباشد. همچنین بر اساس این پروانه ثبت اختراع، "تغییرات ایجاد شده در طی زمان در متن پیوندهای داده شده به یک مدرک ممکن است برای رتبهبندی صفحه دریافت کننده پیوند مدنظر قرار گیرد. برای مثال، تغییرات ایجاد شده در طی زمان در متن پیوندهای داده شده به یک مدرک ممکن است به عنوان نشانهای برای روزآمد شدن و یا حتی تغییر در تأیید مدرک دریافتکننده پیوند، مورد استفاده قرار گیرد."
گوگل متن یک پیوند را هم به عنوان بخشی از صفحهای که به آن پیوند داده شده است و هم به عنوان بخشی از صفحهای که آن پیوند را ایجاد کرده است در نظر میگیرد. "زیرا متن پیوند اغلب به عنوان بخشی از صفحهای که به آن پیوند داده شده است در نظر گرفته میشود" (آچاریا، ۲۰۰۵). لاری پیج (۱۹۹۸) طراح الگوریتم رتبهبندی صفحه‌های وب برای موتور جستجو گوگل، توجیه میکند که متن پیوند به عنوان خلاصهای بسیار موجز از صفحۀ وبی که به آن مربوط میشود، در نظر گرفته میشود. از نقطهنظر یک موتور جستجوی پیوند-محور، هر پیوند دریافتی به یک وبگاه به عنوان یک رأی اعتماد به آن وبگاه تفسیر میشود: رأی بیشتر، رتبه بالاتر.
پیوندهای متنی مبتنی بر اصولیترین شکل از ساختاری است که وب بر مبنای آن ساخته شده است و همیشه حول و حوش آن خواهد بود. موتورهای جستجو، پیوندهای متنی را به عنوان موثقترین نشانۀ اعتبار تلقی میکنند. در واقع، متنی که برای توضیح یک پیوند دریافتی به یک وبگاه استفاده میشود میتواند بر نحوۀ رتبهبندی وبگاه مورد نظر، اثر بگذارد. سه نوع پیوند متنی زیر، همگی به یک وبگاه اشاره دارند؛ حاوی کلیدواژهها یا عنوان وبگاه هستند، اما از متن پیوند مختلفی استفاده میکنند:
موتورهای جستجو میتوانند پیوندهای متنی را در نظر بگیرند. این رویکرد چند مزیت دارد: (الف) متن پیوند اغلب توصیفات دقیقتری از صفحه‌های وب را نسبت به خود صفحه‌ها فراهم میکنند. (ب) پیوند ممکن است برای تصاویر، برنامهها، و سایر اشیاء و منابعی که نمیتوانند به وسیله موتورهای جستجوی مبتنی بر متن نمایهسازی شوند، وجود داشته باشد. علاوهبراین، حتی اگر متن یک مدرک به زبان دیگر باشد و با واژه‌های جستجو۱۲ ارتباط مستقیمی نداشته باشد، اما اگر مدارکی به آن مدرک پیوند ایجاد کرده و در متن پیوند یا عنوان پیوند داده شده به آن مدرک از آن واژه‌های جستجو استفاده نمایند، مدرک موردنظر هنگام جستجو به عنوان یک مدرک مرتبط تلقی شده و بازیابی خواهد شد (پیج، ۲۰۰۱).
● نتیجه گیری
میتوان نتیجه گرفت که موتورهای جستجو بر این باور هستند که هنگام ایجاد پیوند به یک وبگاه، هر واژهای که توسط وبگاههای دیگر برای توصیف آن به کار میرود با آن وبگاه مرتبط هستند حتی اگر کلیدواژهها در متن آن وبگاه یا صفحه وب وجود نداشته باشد. به عبارت دیگر، پیوندهای متنی داده شده به یک وبگاه به زبانهای خارجی، به وبگاه دریافتکننده پیوند اجازه میدهد تا شانسی برای بازیابی شدن به عنوان نتایج مرتبط در پاسخ به یک پرسش جستجو داشته باشد. بسیاری از موتورهای کاوش، صفحه‌های وب ایجادکننده پیوند را تا حدود زیادی بر اساس کیفیت محتوایی صفحه‌هایی که به آنها پیوند ایجاد کردهاند مورد قضاوت قرار میدهند و اگر تعداد زیادی وبگاه به یک وبگاه خاص پیوند ایجاد کنند و از کلیدواژه‌های خاصی در متن پیوند استفاده کنند، موتورهای جستجو رتبه وبگاه دریافتکننده پیوند را برای آن کلیدواژهها افزایش میدهند. در نهایت، پیوندهای دریافتی از وبگاههای محبوب و عمومی با رتبه بالا، ارزش بیشتری از پیوندهای دریافتی از وبگاههای کوچک و ناشناخته دارند.
یادداشتها:
این متن ترجمه‌ای است از:
فراپیوندها و نقش آنها در بازیابی اطلاعات در محیط وب(۱)
۱. Noruzi, A. (۲۰۰۵). Editorial: Hyperlinks and Their Roles in Web Information Retrieval. Webology, ۲(۳), editorial ۵. Available at: http://www.webology.ir/۲۰۰۵/v۲n۳/editorial۵.html
۲. Hyperlink
۳. Navigational link
۴. Website
۵. Backlink / inlink
۶. Text link
۷. Uniform Resource Locator (URL)
۸. World Wide Web Worm
۹. Alternative text
۱۰. Doorway pages
۱۱. HTML
۱۲. Search terms
منابع
Acharya, A., Cutts, M., Dean, J., Haahr, P., Henzinger, M., Hoelzle, U., Lawrence, S., Pfleger, K., Sercinoglu, O., & Tong, S. (۲۰۰۵). Information retrieval based on historical data. United States Patent Application ۲۰۰۵/۰۰۷۱۷۴۱, Kind Code A ۱.
Google (۲۰۰۵). Our search: Google technology, PageRank explained. Retrieved September ۱۵, ۲۰۰۵ from http://www.google.com/technology/index.html
Kleinberg, J. M. (۱۹۹۹). Authoritative sources in a hyperlinked environment. Journal of the ACM , ۴۶(۵), ۶۰۴-۳۲.
McBryan, O.A. (۱۹۹۴). GENVL and WWWW: Tools for taming the Web. In: Proceedings of the First International Conference on the World Wide Web, CERN, Geneva, May ۲۵-۲۷, ۱۹۹۴, pp. ۱-۱۳.
Page, L. (۲۰۰۱). Method for node ranking in a linked database. United States Patent Application ۲۰۰۱/۶۲۸۵۹۹۹, Kind Code B ۱.
Page, L., Brin, S., Motwani, R., & Winograd, T. (۱۹۹۸). The PageRank citation ranking: Bringing order to the Web . Technical report, Stanford University, Stanford, CA, ۱۹۹۸.
Schwartz, B. (۲۰۰۴, July ۱۴). Internal linking structure elements strategy. Retrieved September ۱۵, ۲۰۰۵ from http://www.rustybrick.com/seo_articles_۳.php
Vidals, G. (۲۰۰۱). Strategic link analysis. Retrieved September ۱۵, ۲۰۰۵ from http://www.positionresearch.com/research/link_analysis.html
Ward, E. (۲۰۰۱, December ۱۹). How search engines use link analysis. A special report from the Search Engine Strategies ۲۰۰۱ Conference, November ۱۴-۱۵, Dallas, Texas. Retrieved September ۱۵, ۲۰۰۵ from http://searchenginewatch.com/searchday/article.php/۳۴۷۱۱_۲۱۵۸۴۳۱

مسعود بهمن آبادی