سه شنبه, ۱۴ اسفند, ۱۴۰۳ / 4 March, 2025
مجله ویستا
فراپیوندها و نقش آنها در بازیابی اطلاعات در محیط وب

● مقدمه
یک صفحه وب، عموماً شامل عناصری از قبیل متن، فراپیوند۲، تصاور و ... است. فراپیوند ارتباط بین دو صفحۀ وب یا تنها بین قسمتهایی از یک صفحه را مشخص میکند. شناخت ساختار فراپیوند پایۀ شناخت ساختار ارتباطی وب است، زیرا فراپیوندها در نمایهسازی، بازیابی اطلاعات و رتبهبندی صفحههای وب مورد استفاده قرار میگیرند. اگر وب یک اتومبیل باشد، فراپیوندها موتور آن خواهند بود، زیرا بدون آنها به هیچ جا نمیتوان رفت.
● انواع فراپیوندها
به طور کلی، در محیط وب سه نوع فراپیوند وجود دارد:
۱) پیوند جاینما۳:
پیوند به صفحههای دیگر در یک وبگاه۴ که صفحههای داخل وبگاه را به هم مرتبط میکنند. مانند: "بازگشت به صفحه نخست"، "بازگشت به صفحه اصلی"، "صفحه قبل" و غیره. پیوند جاینما برای سهولت جایابی در وبگاهها به وسیلۀ کاربران نهایی، یک نیاز بنیادی است. همچنین برای نمایهسازی وبگاهها به وسیلۀ رباتهای موتورهای جستجو ضروری میباشد.
۲) پیوند دریافتی۵ (درونی):
پیوندهایی داده شده به یک وبگاه از سوی وبگاههای دیگر، پیوند دریافتی یا پیوند درونی خوانده میشوند. موتورهای جستجو از پیوندهای دریافتی برای نمایهسازی صفحههای وب قابل نمایهسازی به منظور اضافه شدن به پایگاه اطلاعاتی آنها، سنجش ربط و بیربطی منابع بازیابی شده در جواب پرسش کاربران و رتبهبندی منابع، استفاده میکنند. پیوندهای دریافتی مهمتر از پیوندهای جاینما هستند. ایجاد کردن یک پیوند دریافتی به یک صفحه وب، نشاندهنده قضاوت فرد ایجاد کننده آن است، بدین شکل که سازندۀ صفحۀ الف، با ایجاد یک پیوند دریافتی به صفحۀ ب ، تا اندازهای به صفحه ب اعتبار داده است و "قضاوت پنهان افراد" را نشان میدهد (کلاینبرگ، ۱۹۹۹). برای مثال، نظام رتبهبندی صفحههای وب در موتور جستجو گوگل تا حد زیادی مبتنی بر پیوندهای دریافتی است.
۳) پیوند به آدرس پست الکترونیکی (رایانامه) افراد.
از نقطه نظر موتورهای جستجوی پیوند–محور، سه نوع فراپیوند وجود دارد (نگاه شود به شکل ۱).
یک پیوند متنی شامل یک آدرس جاینمای جهانی منبع۷ و گروهی از کلمات است که به عنوان متن پیوند شناخته میشوند.
در زیر مثالی از یک پیوند متنی ساده آورده شده است:
<a href=http://mail.yahoo.com/config/login?/"http://www.ABC.com">underlined anchor text</a>
روباتهای موتورهای جستجو سادگی پیوندهای متنی را به هر نوع دیگر پیوند ترجیح میدهند. در واقع، متن پیوند از نظر موتورهای جستجو بسیار حائز اهمیت است و در محاسبۀ رتبهبندی صفحههای وب توسط موتورهای جستجو در مقایسه با بدنۀ عادی متن به آن اهمیت بیشتری داده میشود. دلیلی که موتورهای جستجو به متن پیوند اهمیت بیشتری میدهند، این است که موتورهای جستجو بر این فرض استوار هستند که نویسندۀ یک صفحه وب تنها به صفحههایی پیوند میدهد که از نظر وی مهم هستند. اگر وی یک صفحه وب را مهم بداند، به طبع موتورهای جستجو هم آن را مهم میپندارد. به همین دلیل نویسندگان وب میدانند که باید به صفحههای مهم پیوند دهند و باید از کلیدواژههای مناسب در متن پیوند استفاده کنند. ایدۀ ارتباط متن پیوند با صفحهای که متن به آن اشاره دارد نخستینبار توسط یکی از موتورهای جستجو معروف به "خزنده وب جهانگستر۸ " استفاده شد (مکبرایان، ۱۹۹۴) که بعدها به وسیله سایر موتورهای جستجو به کار گرفته شد.
روبات موتورهای جستجو نمیتوانند نوشتههای گرافیکی را بخوانند و اگر حالت گرافیکی در واقع نمایش تصویری یک کلمه باشد، مانند "درباره ما" (About Us) آنگاه یک موتور جستجو چگونه میتواند آن را تشخیص دهد؟ در تمام مواردی که از گرافیک استفاده میشود، معقول است که از برچسب متن برابر۹ (ALT) همراه با کد منبع تصویر استفاده شود. به عنوان مثال، متن برابر برای مثال بالا به شکل زیر است:
<a href=http://mail.yahoo.com/config/login?/"http://www.ABC.com/aboutus.html"><img src=http://mail.yahoo.com/config/login?/"/aboutus.jpg" alt="Short Text Explaining Where the Graphic Link will Take Visitor"></a>
برچسب ALT به جای متن پیوند، موتورهای جستجو را قادر میسازد تا مثل خوانندگان صفحه، به گرافیکها معنا دهند. بنابراین، هنگام ایجاد پیوند به صفحههای وب استفاده از کلیدواژه های خاص در برچسب ALT بسیار مهم است (شوارتز، ۲۰۰۳).
بنابراین، زمینه پیوند، جنبه مهمی برای تحلیل پیوندهاست. زمینه پیوند نشان میدهد که یک پیوند که بر روی یک صفحه وب ظاهر میشود تا چه اندازه با کلیدواژه های متن صفحههای که به آن پیوند داده شده است مرتبط است. به نظر میرسد که موتورهای جستجو به یک وبگاه با محتوا در مقایسه با وبگاهی که از لحاظ محتوایی چیزی ندارد بلکه صرفاً صفحههای درگاهی۱۰ خوبی دارد، بیشتر ارزش میدهند (وارد، ۲۰۰۱). تمام پیوندها به طور مشابه و برابر ساخته نشدهاند، بلکه برخی نسبت به بقیه مهمتر هستند. مفهوم ساده است.
پیوندهای گرافیکی و وابستگی، بهطور کلی برای بازاربابی و تجارت هستند. اینگونه پیوندها میتوانند "خریداری" شوند، بنابراین موتورهای جستجو به آنها ارزشی نمیدهند. اما یک پیوند متنی نیاز به یک نویسندۀ وب برای بررسی و کنترل وبگاه مورد نظر و سپس ساخت یک فراپیوند دارد. این برای همه مشهود است. بدین معنی که نویسندۀ وب به موضوع و کیفیت صفحه وب یا وبگاه مورد نظر از طریق فراپیوند اعتبار میدهد. هنگامی که متن یک پیوند، بدنه یا عنوان پیوند شامل کلیدواژهها باشند، پیوند ارزش بیشتری دارد و رتبه صفحه دریافتکننده پیوند را در موتورهای جستجو بالا میبرد. مثالی از یک پیوند متنی حاوی کلیدواژهها در عنوان پیوند به صورت زیر است:
<a href=http://mail.yahoo.com/config/login?/"http://www.IFLA.org/" title="International Federation of Library Associations and Institutions (IFLA)">IFLA</a>
برای توضیح کامل و جامع پیوندهای متنی، باید به روزهای اول وب برگشت. وب در ابتدا با فراهمآوری اطلاعات در صفحههای وب ایجاد شده به زبان نشانهگذاری فرامتن۱۱ و با تصاویر گرافیکی بسیار کم شروع به کار کرد. هنگامی که صفحههای وب اولیه میخواستند به سایر منابع اطلاعاتی که با موضوع آنها مرتبط بودند ارجاع دهند، پیوندهای متنی ایجاد میکردند. از این رو وب بر پایۀ پیوندهای متنی ساخته شد. بیشترین اهمیت پیوندهای متنی، هنگامی است که به یک منبع وب اشاره دارند. بنابراین، پیوندهای متنی برای ترقی دادن یک وبگاه حائز اهمیت هستند، زیرا پیوندها:
یک پیوند مستقیم مبتنی بر متن پیوند ساخته شده با کلیدواژهها و یا عنوان، به منظور تسهیل فرایند بازدید از وبگاه توسط بازدیدکنندگان فراهم میکنند و رفت و برگشت را بدون تغییر مسیر مجدد سرور میسر میسازند.
به عنوان یک رأی یا فزایندۀ اعتبار و عمومیت وبگاهها خدمت میکنند که تمام موتورهای جستجوی عمده مانند گوگل، هنگام رتبهبندی صفحههای وب مرتبط با یک جستجو انجام شده توسط کاربری که به دنبال واژهها یا عبارتهای مرتبط با یک وبگاه یا صفحه وب است از آن استفاده میکنند. "گوگل یک پیوند ایجاد شده در صفحۀ الف به صفحۀ ب را به عنوان یک رأی از جانب صفحۀ الف برای صفحۀ ب تفسیر میکند. اما گوگل چیزهای دیگری غیر از حجم صرف رأیها و یا پیوندهایی که یک صفحه وب دریافت میکند، مورد توجه قرار میدهد. گوگل حتی صفحهای که رأی را مطرح کرده است را نیز تحلیل مینماید. رأیهای داده شده از جانب صفحههایی که خود از اهمیت زیادی برخوردارند، حائز اهمیت بیشتری هستند و به صفحههای دیگر کمک میکنند تا حائز اهمیت گردند." (گوگل، ۲۰۰۵).
موتورهای جستجوی مختلف از الگوریتمهای رتبهبندی گوناگونی استفاده میکنند و شکل واقعی آنها به صورت یک راز نگه داشته میشود. اما گوگل پروانه ثبت اختراعی با عنوان "بازیابی اطلاعات بر پایه دادههای گذشتهنگر" در ۳۱ مارس ۲۰۰۵ تکمیل کرد که تا حد زیادی نحوه رتبهبندی وبگاهها و صفحههای وب را آشکار نمود. انتشار این پروانه ثبت که حاوی ۶۳ بند بود، تعداد زیادی از ضوابط و ملاکهای رتبهبندی را فاش کرد. این پروانه ثبت شیوهای را ادعا میکند که شامل "مشخص کردن تاریخ آغاز یک مدرک، و رتبه بندی مدرک (حداقل تا حدودی) بر پایه میزان پیوندهایی دریافتی از سایر وبگاهها، تاریخ ایجاد پیوند به آن مدرک، تاریخ تغییر پیوندها به آن مدرک، تاریخ ایجاد یک پیوند متنی به آن مدرک، تاریخ ایجاد صفحه حاوی پیوند به آن مدرک، و تاریخ تغییرات ایجاد شده در صفحهای که به آن مدرک پیوند داده است" میباشد. همچنین بر اساس این پروانه ثبت اختراع، "تغییرات ایجاد شده در طی زمان در متن پیوندهای داده شده به یک مدرک ممکن است برای رتبهبندی صفحه دریافت کننده پیوند مدنظر قرار گیرد. برای مثال، تغییرات ایجاد شده در طی زمان در متن پیوندهای داده شده به یک مدرک ممکن است به عنوان نشانهای برای روزآمد شدن و یا حتی تغییر در تأیید مدرک دریافتکننده پیوند، مورد استفاده قرار گیرد."
گوگل متن یک پیوند را هم به عنوان بخشی از صفحهای که به آن پیوند داده شده است و هم به عنوان بخشی از صفحهای که آن پیوند را ایجاد کرده است در نظر میگیرد. "زیرا متن پیوند اغلب به عنوان بخشی از صفحهای که به آن پیوند داده شده است در نظر گرفته میشود" (آچاریا، ۲۰۰۵). لاری پیج (۱۹۹۸) طراح الگوریتم رتبهبندی صفحههای وب برای موتور جستجو گوگل، توجیه میکند که متن پیوند به عنوان خلاصهای بسیار موجز از صفحۀ وبی که به آن مربوط میشود، در نظر گرفته میشود. از نقطهنظر یک موتور جستجوی پیوند-محور، هر پیوند دریافتی به یک وبگاه به عنوان یک رأی اعتماد به آن وبگاه تفسیر میشود: رأی بیشتر، رتبه بالاتر.
پیوندهای متنی مبتنی بر اصولیترین شکل از ساختاری است که وب بر مبنای آن ساخته شده است و همیشه حول و حوش آن خواهد بود. موتورهای جستجو، پیوندهای متنی را به عنوان موثقترین نشانۀ اعتبار تلقی میکنند. در واقع، متنی که برای توضیح یک پیوند دریافتی به یک وبگاه استفاده میشود میتواند بر نحوۀ رتبهبندی وبگاه مورد نظر، اثر بگذارد. سه نوع پیوند متنی زیر، همگی به یک وبگاه اشاره دارند؛ حاوی کلیدواژهها یا عنوان وبگاه هستند، اما از متن پیوند مختلفی استفاده میکنند:
موتورهای جستجو میتوانند پیوندهای متنی را در نظر بگیرند. این رویکرد چند مزیت دارد: (الف) متن پیوند اغلب توصیفات دقیقتری از صفحههای وب را نسبت به خود صفحهها فراهم میکنند. (ب) پیوند ممکن است برای تصاویر، برنامهها، و سایر اشیاء و منابعی که نمیتوانند به وسیله موتورهای جستجوی مبتنی بر متن نمایهسازی شوند، وجود داشته باشد. علاوهبراین، حتی اگر متن یک مدرک به زبان دیگر باشد و با واژههای جستجو۱۲ ارتباط مستقیمی نداشته باشد، اما اگر مدارکی به آن مدرک پیوند ایجاد کرده و در متن پیوند یا عنوان پیوند داده شده به آن مدرک از آن واژههای جستجو استفاده نمایند، مدرک موردنظر هنگام جستجو به عنوان یک مدرک مرتبط تلقی شده و بازیابی خواهد شد (پیج، ۲۰۰۱).
● نتیجه گیری
میتوان نتیجه گرفت که موتورهای جستجو بر این باور هستند که هنگام ایجاد پیوند به یک وبگاه، هر واژهای که توسط وبگاههای دیگر برای توصیف آن به کار میرود با آن وبگاه مرتبط هستند حتی اگر کلیدواژهها در متن آن وبگاه یا صفحه وب وجود نداشته باشد. به عبارت دیگر، پیوندهای متنی داده شده به یک وبگاه به زبانهای خارجی، به وبگاه دریافتکننده پیوند اجازه میدهد تا شانسی برای بازیابی شدن به عنوان نتایج مرتبط در پاسخ به یک پرسش جستجو داشته باشد. بسیاری از موتورهای کاوش، صفحههای وب ایجادکننده پیوند را تا حدود زیادی بر اساس کیفیت محتوایی صفحههایی که به آنها پیوند ایجاد کردهاند مورد قضاوت قرار میدهند و اگر تعداد زیادی وبگاه به یک وبگاه خاص پیوند ایجاد کنند و از کلیدواژههای خاصی در متن پیوند استفاده کنند، موتورهای جستجو رتبه وبگاه دریافتکننده پیوند را برای آن کلیدواژهها افزایش میدهند. در نهایت، پیوندهای دریافتی از وبگاههای محبوب و عمومی با رتبه بالا، ارزش بیشتری از پیوندهای دریافتی از وبگاههای کوچک و ناشناخته دارند.
یادداشتها:
این متن ترجمهای است از:
فراپیوندها و نقش آنها در بازیابی اطلاعات در محیط وب(۱)
۱. Noruzi, A. (۲۰۰۵). Editorial: Hyperlinks and Their Roles in Web Information Retrieval. Webology, ۲(۳), editorial ۵. Available at: http://www.webology.ir/۲۰۰۵/v۲n۳/editorial۵.html
۲. Hyperlink
۳. Navigational link
۴. Website
۵. Backlink / inlink
۶. Text link
۷. Uniform Resource Locator (URL)
۸. World Wide Web Worm
۹. Alternative text
۱۰. Doorway pages
۱۱. HTML
۱۲. Search terms
منابع
Acharya, A., Cutts, M., Dean, J., Haahr, P., Henzinger, M., Hoelzle, U., Lawrence, S., Pfleger, K., Sercinoglu, O., & Tong, S. (۲۰۰۵). Information retrieval based on historical data. United States Patent Application ۲۰۰۵/۰۰۷۱۷۴۱, Kind Code A ۱.
Google (۲۰۰۵). Our search: Google technology, PageRank explained. Retrieved September ۱۵, ۲۰۰۵ from http://www.google.com/technology/index.html
Kleinberg, J. M. (۱۹۹۹). Authoritative sources in a hyperlinked environment. Journal of the ACM , ۴۶(۵), ۶۰۴-۳۲.
McBryan, O.A. (۱۹۹۴). GENVL and WWWW: Tools for taming the Web. In: Proceedings of the First International Conference on the World Wide Web, CERN, Geneva, May ۲۵-۲۷, ۱۹۹۴, pp. ۱-۱۳.
Page, L. (۲۰۰۱). Method for node ranking in a linked database. United States Patent Application ۲۰۰۱/۶۲۸۵۹۹۹, Kind Code B ۱.
Page, L., Brin, S., Motwani, R., & Winograd, T. (۱۹۹۸). The PageRank citation ranking: Bringing order to the Web . Technical report, Stanford University, Stanford, CA, ۱۹۹۸.
Schwartz, B. (۲۰۰۴, July ۱۴). Internal linking structure elements strategy. Retrieved September ۱۵, ۲۰۰۵ from http://www.rustybrick.com/seo_articles_۳.php
Vidals, G. (۲۰۰۱). Strategic link analysis. Retrieved September ۱۵, ۲۰۰۵ from http://www.positionresearch.com/research/link_analysis.html
Ward, E. (۲۰۰۱, December ۱۹). How search engines use link analysis. A special report from the Search Engine Strategies ۲۰۰۱ Conference, November ۱۴-۱۵, Dallas, Texas. Retrieved September ۱۵, ۲۰۰۵ from http://searchenginewatch.com/searchday/article.php/۳۴۷۱۱_۲۱۵۸۴۳۱
مسعود بهمن آبادی
این متن ترجمهای است از:
فراپیوندها و نقش آنها در بازیابی اطلاعات در محیط وب(۱)
۱. Noruzi, A. (۲۰۰۵). Editorial: Hyperlinks and Their Roles in Web Information Retrieval. Webology, ۲(۳), editorial ۵. Available at: http://www.webology.ir/۲۰۰۵/v۲n۳/editorial۵.html
۲. Hyperlink
۳. Navigational link
۴. Website
۵. Backlink / inlink
۶. Text link
۷. Uniform Resource Locator (URL)
۸. World Wide Web Worm
۹. Alternative text
۱۰. Doorway pages
۱۱. HTML
۱۲. Search terms
منابع
Acharya, A., Cutts, M., Dean, J., Haahr, P., Henzinger, M., Hoelzle, U., Lawrence, S., Pfleger, K., Sercinoglu, O., & Tong, S. (۲۰۰۵). Information retrieval based on historical data. United States Patent Application ۲۰۰۵/۰۰۷۱۷۴۱, Kind Code A ۱.
Google (۲۰۰۵). Our search: Google technology, PageRank explained. Retrieved September ۱۵, ۲۰۰۵ from http://www.google.com/technology/index.html
Kleinberg, J. M. (۱۹۹۹). Authoritative sources in a hyperlinked environment. Journal of the ACM , ۴۶(۵), ۶۰۴-۳۲.
McBryan, O.A. (۱۹۹۴). GENVL and WWWW: Tools for taming the Web. In: Proceedings of the First International Conference on the World Wide Web, CERN, Geneva, May ۲۵-۲۷, ۱۹۹۴, pp. ۱-۱۳.
Page, L. (۲۰۰۱). Method for node ranking in a linked database. United States Patent Application ۲۰۰۱/۶۲۸۵۹۹۹, Kind Code B ۱.
Page, L., Brin, S., Motwani, R., & Winograd, T. (۱۹۹۸). The PageRank citation ranking: Bringing order to the Web . Technical report, Stanford University, Stanford, CA, ۱۹۹۸.
Schwartz, B. (۲۰۰۴, July ۱۴). Internal linking structure elements strategy. Retrieved September ۱۵, ۲۰۰۵ from http://www.rustybrick.com/seo_articles_۳.php
Vidals, G. (۲۰۰۱). Strategic link analysis. Retrieved September ۱۵, ۲۰۰۵ from http://www.positionresearch.com/research/link_analysis.html
Ward, E. (۲۰۰۱, December ۱۹). How search engines use link analysis. A special report from the Search Engine Strategies ۲۰۰۱ Conference, November ۱۴-۱۵, Dallas, Texas. Retrieved September ۱۵, ۲۰۰۵ from http://searchenginewatch.com/searchday/article.php/۳۴۷۱۱_۲۱۵۸۴۳۱
مسعود بهمن آبادی
ایران مسعود پزشکیان دولت چهاردهم پزشکیان مجلس شورای اسلامی محمدرضا عارف دولت مجلس کابینه دولت چهاردهم اسماعیل هنیه کابینه پزشکیان محمدجواد ظریف
پیاده روی اربعین تهران عراق پلیس تصادف هواشناسی شهرداری تهران سرقت بازنشستگان قتل آموزش و پرورش دستگیری
ایران خودرو خودرو وام قیمت طلا قیمت دلار قیمت خودرو بانک مرکزی برق بازار خودرو بورس بازار سرمایه قیمت سکه
میراث فرهنگی میدان آزادی سینما رهبر انقلاب بیتا فرهی وزارت فرهنگ و ارشاد اسلامی سینمای ایران تلویزیون کتاب تئاتر موسیقی
وزارت علوم تحقیقات و فناوری آزمون
رژیم صهیونیستی غزه روسیه حماس آمریکا فلسطین جنگ غزه اوکراین حزب الله لبنان دونالد ترامپ طوفان الاقصی ترکیه
پرسپولیس فوتبال ذوب آهن لیگ برتر استقلال لیگ برتر ایران المپیک المپیک 2024 پاریس رئال مادرید لیگ برتر فوتبال ایران مهدی تاج باشگاه پرسپولیس
هوش مصنوعی فناوری سامسونگ ایلان ماسک گوگل تلگرام گوشی ستار هاشمی مریخ روزنامه
فشار خون آلزایمر رژیم غذایی مغز دیابت چاقی افسردگی سلامت پوست