سه شنبه, ۱۶ بهمن, ۱۴۰۳ / 4 February, 2025
چشم اندازهایی بر وب سنجی
از اواسط دهه ۱۹۹۰ حوزه پژوهشی جدیدی به نام «وبسنجی» بر پایه روشهای اطلاعسنجی جدید به وجود آمد كه كار آن، پژوهش درباره ماهیت و خصوصیات وب است. این مقاله سعی دارد حوزههای منتخبی از پژوهش وب سنجی را كه روند و فضای مناسبی برای توسعه دارند و همچنین برخی حوزههایی را كه در حال حاضر كمتر دارای آیندهای روشن هستند معرفی كند. پژوهشهای جدید درباره پوشش و عملكرد موتورهای كاوش، آنها را به عنوان قالب و چارچوبی برای تحلیل گزینشی كیفیت و محتوا، شناخته است.مشكلات مربوط به عوامل تأثیرگذار وب مورد بحث قرار گرفته است و در پایان مقاله راهنماییهای جدید وبسنجی برای اجرای كشف دانش و ردیابی موضوع روی وب-كه تا حدودی مبتنی بر روش كتابسنجی استفاده شده در پایگاههای اطلاعاتی استنادی و كتابشناختی است- به صورت كلی مطرح شده است. در این چارچوب راهبردهای نظریه نمودار یكپارچه، شامل: تحلیل مسیر، پیوندهای متقاطع (عرضی)، پیوندهای ضعیف و پدیده جهان كوچك مورد توجه قرار گرفته است.از اواسط دهه ۱۹۹۰ تلاشهای روزافزونی برای بررسی ماهیت و خصوصیات وب جهان گستر كه در این مقاله «وب» نامیده میشود، با به كارگیری روش اطلاعسنجی جدید برای فضای محتویات آن، ساختار پیوندها۱ و موتورهای کاوش، صورت پذیرفت. مطالعه روی وب در سال ۱۹۹۷ را آلمایند و اینگورسن۲ وبسنجی نامیده و یا در مجلهای الکترونیکی با عنوان سایبرمتریك۳ در سال ۱۹۹۷ سایبرمتریك (مجازی سنجی) نامگذاری شد. این مقاله سعی دارد حوزههای منتخبی از پژوهش وبسنجی را که فضای مناسبی برای توسعه دارند، معرفی كند.این نوشته مقاله كاملی نیست، اما نسبتاً تخصصی است. وبسنجی شباهتهای متعددی با مطالعات علمسنجی، اطلاعسنجی و كاربرد روشهای کتابسنجی متداول دارد. برای مثال، محاسبات ساده و تحلیل محتوای صفحات وب، شبیه به تحلیل انتشارات سنتی هستند؛ محاسبه و تجزیه و تحلیل پیوندهای بیرون رونده از صفحات وب كه در اینجا پیوندهای بیرونی۴ و پیوندهایی كه به خود صفحات وب داده میشوند، پیوندهای درونی۵ نامیده میشوند به ترتیب به عنوان مرجع (مأخذ)۶ و تحلیل استنادی۷ در نظر گرفته میشوند. بنابراین، در مقالات علمی، پیوندهای بیرونی و درونی به ترتیب شبیه مراجع(مآخذ) و استنادها هستند. هرچند وب به علت ماهیت پویا و توزیعی، غالباً صفحاتش را كه به صورت همزمان به یكدیگر پیوند داده شدهاند- حالتی كه در كتاب به شكل سنتی امكان ندارد- در فضایی كه بر پایه استناد گذارده شده نمایش می دهد. پوشش موتورهای کاوش در سراسر وب میتواند به همان شیوهای كه پوشش حوزه۸ و پایگاههای اطلاعاتی استنادی در کل اسناد و مدارک و امكان همپوشانیهای بین موتورهای شناسایی شده، مورد پژوهش قرار گیرد. از آن زمانی كه وب از مشاركت هر كسی كه دوست داشت در آن شركت كند برخوردار شد، در نتیجه فقدان بازبینیهای دقیق، كیفیت اطلاعات یا ارزش دانش دچار ابهام گردید؛ اما تحلیل پیوندها ممكن است گروهی از سایتهای تجدیدنظر و بازبینی شده را نشان دهد. الگوهای رفتارِ کاوش در وب۹ میتواند، مانند مطالعات اطلاع یابی سنتی، مورد پژوهش قرار گیرد.ردیابی موضوع در محیط وب تأمین شده و اقداماتی برای کشف دانش، شبیه به دادههای رایج (مشترک۱۰) یا متن کاوی (استخراج متن۱۱) در پایگاههای اطلاعاتی متنی (کتابشناختی) یا اداری (اجرایی) انجام گرفته است. از زمانی كه وب فضای اطلاعاتی كاملاً متفاوتی از سایر پایگاههای اطلاعاتیِ علمی یا حرفهای متداول، شده است، بعضی وقتها شباهتهای مذكور ممكن است به صورت كم عمق و سطحی ظاهر گردد. برای مثال، ما با اطمینان نمی دانیم كه چرا مردم در وب به سایر صفحات پیوند می دهند.
هیچ قراردادی برای استناد در محیط وب همانند آثار علمی چاپی وجود ندارد. علاوه بر این، زمان نقش متفاوتی بر روی وب ایفا مینماید. از سوی دیگر، به دلیل این كه وب مجموعهای است بسیار پیچیده از کلیه انواع اطلاعاتی كه به وسیله انسان های متفاوت تولید میشود و همچنین توسط كاربران مختلف مورد جستجو قرار میگیرد، موضوع جالبی برای پژوهش است، و در واقع، اطلاعسنجی روشهایی را برای شروع پژوهش در وب ارائه میكند. هرچند یك نفر باید با درخواست پیوسته از پایگاههای اطلاعاتی استنادی كنترل شده توسط مؤسسه اطلاعات علمی۱۲ آگاه شود، برای مثال، از طریق زبان دستور۱۳ پایگاه اطلاعاتی دایالوگ. گردآوری دادهها در محیط وب، به ویژگیها و خصوصیات بازیابی موتورهای کاوش مختلف و روباتهای وب، بستگی دارد. پیش از ظهور دستور set posting on در پایگاه اطلاعاتی دایالوگ۱۴ در طی دهه ۱۹۹۰، محاسبه استنادها به صورت پیوسته امكان پذیر نبود. یك نفر باید تمام مدارك استناد شده را جهت تحلیل به صورت محلی، به منظور شمارش تعداد واقعی استنادها در فضای اطلاعاتی تعریف شده به وسیله موسسه اطلاعات علمی، بارگذاری (فروفرستی) می کرد. امروزه این حالتی است كه در اكثر موتورهای وب وجود دارد كه روسو در سالهای ۱۹۹۷ و ۱۹۹۹ آن را اثبات كرد.
این موتورها كل وب را نمایهسازی نمیكنند، همپوشانی آنها قابل توجه نیست (لارنس و گیلز، ۱۹۹۹) و ویژگیهای بازیابی آنها برای تحلیلهای وبسنجی گسترده پیوسته۱۵ بسیار ساده است. بنابراین، نمونهگیری بسیار مهم و حساس است، ولی اجرای آن مشكل است و پالایش آن ضروری است، به همین جهت مهندسی مجدد و پاكسازی اطلاعات در تحلیلهای وبسنجی عنصری مهم است.این مقاله به برخی از پژوهشهای اخیر كه عملكرد و پوشش موتورهای وب را به عنوان چارچوبی برای تحلیلهای گزینشی كیفیت و محتوا مورد توجه قرار داده اند، اشاره مینماید و سپس ما به دنبال تحلیل سایتها (پیوندها) ۱۶ مانند تحلیل «پیوند-صفحه»۱۷ در اصطلاحات روسو (۱۹۹۷) و مطالعات عامل تأثیرگذار وب هستیم. تلاشهایی به منظور فراهم کردن مسیرهای جدید خروجی (برون رفت) وبسنجی از طریق اجرای كشف دانش و ردیابی موضوع، به عنوان مثال به وسیله ساختار پیوندهای متقاطع و پیوندهای ضعیف، در نتیجهگیری مقاله مورد بحث قرار گرفته اند.
● پژوهشهای كیفی و پوششی موتورهای وب
لورنس و گیلز (۱۹۹۸) مقالهای بنیادی نوشتند که در آن پوشش موتورهای کاوش تجاری در محیط وب را با معرفی محتوای وب قابل نمایهسازی»۱۸، مدنظر قرار دادند. مفهوم وب قابل نمایهسازی بر بخشی از وب كه میتواند با موتورهای کاوش نمایه شود به استثنای اسناد و مدارک پایگاههای اطلاعاتی، مانند دایالوگ، دلالت دارد. آزمون گستردهای كه در دسامبر ۱۹۹۷ بین ۶ موتور کاوش برتر تجاری اصلی یعنی: آلتاویستا، هات بات، نورثرن لایت، اینفوسیک، لیکوس و اکسایت انجام گرفت، سطح پایینی از قابلیت نمایهسازی وب در حدود ۳۲۰ میلیون صفحه را نشان داد. این پژوهش همچنین نشان داد كه پوشش هر یك از موتورها به صورت قابل ملاحظهای، با نمایهسازی یك سوم «وب قابل نمایهسازی» محدود شدهاست.احتمالاً دلایل زیادی برای این نتیجهگیری وجود دارد. به عنوان مثال، عمق و جامعیت نمایهسازی در خدمت دهنده۱۹های محلی بازدید شده به وسیله موتورهای کاوش به چگونگی سازماندهی و ساختار یك سایت، كه ممكن است خروجی بازیابی را تحت تأثیر قرار دهد بستگی دارد، همان طور كه ممكن است روش نمایهسازی، واژههای پرسش (سؤال) را تحت تأثیر قرار دهد.
برای مثال، از طریق کوتاهسازی تحمیلی۲۰ مدارک وبی طولانی، تلاشهای دیگری نیز برای ارزشیابی موتورهای وب انجام شده است، مثلاً مشاهده كیفیت فهرستهای رتبه بندی شده مدارک وب كه به وسیله موتورهای اصلی بازیابی شدهاند (كورتوا و بری، ۱۹۹۹). در کنار سایر یافتهها، این مقاله در مورد دانش كم و بیش در دسترس عموم و درباره ویژگیهای مختلف نمایهسازی و بازیابی كه به وسیله هر یك از موتورها استفاده شده است، بحث میكند. روش ارزیابی موتورهای وب به وسیله کلارک و ویلت۲۱ (۱۹۹۷) که آلتاویستا، لیکوس و اکسایت را با هم مقایسه نمودند، مطرح شده است. علاوه براین، آن مقاله، ارزیابی انتقادی از پژوهشهای پیشین را نشان داده و روشی واقعبینانه و معقول را که شامل اندازهگیری جامعیت نسبی است، فراهم میكند. همچنین آن مقاله نتیجه گرفت كه آلتاویستا به صورت قابل ملاحظهای بهتر از لیکوس و اکسایت عمل کرده است. اُپنهایم۲۲ و دیگران (۲۰۰۰) پژوهشی مشروح و روزآمد درباره ارزیابی موتورهای کاوش وب، شامل بحثی در باب روشهای آزمون، فراهم نمودند. در حالی كه بسیاری از مطالعات ارزیابی و پوششی به ربط و تعداد صفحات وب در یك زمان معین توجه میكنند، سایر تحلیلهای انتقادی، بازیابی پیوند- صفحه را در بر می گیرند (سیندر و رزنباوم، ۱۹۹۹) و یا پژوهشهای ساختاری یا پوششی وب مبتنی بر سریهای زمانی۲۳ را پوشش می دهند. اسنایدر و روزنبوم نیز مانند اینگورسن(۱۹۹۸) ناهماهنگیها و تفاوتهای زیادی را به ویژه در رابطه با بازیابی پیوند-صفحه موتور آلتاویستا مشاهده كردند. بی نظمیهای آن موتور را همچنین بار- ایلان (۱۹۹۹) در یك مطالعه طولی۲۴ و نیز روسو (۱۹۹۹) كسی كه دو موتور آلتاویستا و نورثرن لایت را طی ۲۱ هفته به صورت روزانه در طی سال ۱۹۹۹ مورد مقایسه قرار داده بود، گزارش كردهاند.مطالعه بعدی از سه واژه مفردِ عام یکسان به عنوان پرسش (واژههای جستجو) در طولِ مدت ارزیابی استفاده کرد. در حالی که نورثرن لایت، همان طور که پیشبینی شده بود، یک افزایش ثابت و منظم از موفقیتهای همزمان با گسترش وب را نشان می داد، آلتاویستا در شکل(فرم) بسیار ثابت و جدیدی مجدداً آغاز به کار کرد و گوناگونی و تغییرات زیادی را در طول زمان تا یک تاریخ به خصوص (۲۵ اکتبر۱۹۹۹) نشان می داد. در آن تاریخ تعداد صفحات وب بازیابی شده به طور چشمگیری همراه با این تأثیر شبه نو اختر۲۵ مبتنی بر پرسش افزایش یافت(روسو، ۱۹۹۹، ص۵).
ایران مسعود پزشکیان دولت چهاردهم پزشکیان مجلس شورای اسلامی محمدرضا عارف دولت مجلس کابینه دولت چهاردهم اسماعیل هنیه کابینه پزشکیان محمدجواد ظریف
پیاده روی اربعین تهران عراق پلیس تصادف هواشناسی شهرداری تهران سرقت بازنشستگان قتل آموزش و پرورش دستگیری
ایران خودرو خودرو وام قیمت طلا قیمت دلار قیمت خودرو بانک مرکزی برق بازار خودرو بورس بازار سرمایه قیمت سکه
میراث فرهنگی میدان آزادی سینما رهبر انقلاب بیتا فرهی وزارت فرهنگ و ارشاد اسلامی سینمای ایران تلویزیون کتاب تئاتر موسیقی
وزارت علوم تحقیقات و فناوری آزمون
رژیم صهیونیستی غزه روسیه حماس آمریکا فلسطین جنگ غزه اوکراین حزب الله لبنان دونالد ترامپ طوفان الاقصی ترکیه
پرسپولیس فوتبال ذوب آهن لیگ برتر استقلال لیگ برتر ایران المپیک المپیک 2024 پاریس رئال مادرید لیگ برتر فوتبال ایران مهدی تاج باشگاه پرسپولیس
هوش مصنوعی فناوری سامسونگ ایلان ماسک گوگل تلگرام گوشی ستار هاشمی مریخ روزنامه
فشار خون آلزایمر رژیم غذایی مغز دیابت چاقی افسردگی سلامت پوست