سه شنبه, ۱۶ بهمن, ۱۴۰۳ / 4 February, 2025
مجله ویستا

چشم اندازهایی بر وب سنجی


چشم اندازهایی بر وب سنجی

از اواسط دهه ۱۹۹۰ حوزه پژوهشی جدیدی به نام «وب سنجی» بر پایه روش های اطلاع سنجی جدید به وجود آمد كه كار آن, پژوهش درباره ماهیت و خصوصیات وب است

از اواسط دهه ۱۹۹۰ حوزه پژوهشی جدیدی به نام «وب‌سنجی» بر پایه روش‌های اطلاع‌سنجی جدید به وجود آمد كه كار آن، پژوهش درباره ماهیت و خصوصیات وب است. این مقاله سعی دارد حوزه‌های منتخبی از پژوهش وب سنجی را كه روند و فضای مناسبی برای توسعه دارند و همچنین برخی حوزه‌هایی را كه در حال حاضر كمتر دارای آینده‌ای روشن هستند معرفی كند. پژوهش‌های جدید درباره پوشش و عملكرد موتورهای كاوش، آنها را به عنوان قالب و چارچوبی برای تحلیل گزینشی كیفیت و محتوا، شناخته است.مشكلات مربوط به عوامل تأثیرگذار وب مورد بحث قرار گرفته است و در پایان مقاله راهنمایی‌های جدید وب‌سنجی برای اجرای كشف دانش و ردیابی موضوع روی وب-كه تا حدودی مبتنی بر روش كتابسنجی استفاده شده در پایگاههای اطلاعاتی استنادی و كتابشناختی است- به صورت كلی مطرح شده است. در این چارچوب راهبردهای نظریه نمودار یكپارچه، شامل: تحلیل مسیر، پیوندهای متقاطع (عرضی)، پیوندهای ضعیف و پدیده جهان كوچك مورد توجه قرار گرفته است.از اواسط دهه ۱۹۹۰ تلاش‌های روزافزونی برای بررسی ماهیت و خصوصیات وب جهان گستر كه در این مقاله «وب» نامیده می‌شود، با به كارگیری روش اطلاع‌سنجی جدید برای فضای محتویات آن، ساختار پیوندها۱ و موتورهای کاوش، صورت پذیرفت. مطالعه روی وب در سال ۱۹۹۷ را آلمایند و اینگورسن۲ وب‌سنجی نامیده و یا در مجله‌ای الکترونیکی با عنوان سایبرمتریك۳ در سال ۱۹۹۷ سایبرمتریك (مجازی سنجی) نامگذاری شد. این مقاله سعی دارد حوزه‌های منتخبی از پژوهش وب‌سنجی را که فضای مناسبی برای توسعه دارند، معرفی كند.این نوشته مقاله كاملی نیست، اما نسبتاً تخصصی است. وب‌سنجی شباهت‌های متعددی با مطالعات علم‌سنجی، اطلاع‌سنجی و كاربرد روش‌های کتابسنجی متداول دارد. برای مثال، محاسبات ساده و تحلیل محتوای صفحات وب، شبیه به تحلیل انتشارات سنتی هستند؛ محاسبه و تجزیه و تحلیل پیوندهای بیرون رونده از صفحات وب كه در اینجا پیوندهای بیرونی۴ و پیوندهایی كه به خود صفحات وب داده می‌شوند، پیوندهای درونی۵ نامیده می‌شوند به ترتیب به عنوان مرجع (مأخذ)۶ و تحلیل استنادی۷ در نظر گرفته می‌شوند. بنابراین، در مقالات علمی، پیوندهای بیرونی و درونی به ترتیب شبیه مراجع(مآخذ) و استنادها هستند. هرچند وب به علت ماهیت پویا و توزیعی، غالباً صفحاتش را كه به صورت همزمان به یكدیگر پیوند داده شده‌اند- حالتی كه در كتاب به شكل سنتی امكان ندارد- در فضایی كه بر پایه استناد گذارده شده نمایش می دهد. پوشش موتورهای کاوش در سراسر وب می‌تواند به همان شیوه‌ای كه پوشش حوزه۸ و پایگاه‌های اطلاعاتی استنادی در کل اسناد و مدارک و امكان همپوشانی‌های بین موتورهای شناسایی شده، مورد پژوهش قرار گیرد. از آن زمانی كه وب از مشاركت هر كسی كه دوست داشت در آن شركت كند برخوردار شد، در نتیجه فقدان بازبینی‌های دقیق، كیفیت اطلاعات یا ارزش دانش دچار ابهام گردید؛ اما تحلیل پیوندها ممكن است گروهی از سایت‌های تجدیدنظر و بازبینی شده را نشان دهد. الگوهای رفتارِ کاوش در وب۹ می‌تواند، مانند مطالعات اطلاع یابی سنتی، مورد پژوهش قرار گیرد.ردیابی موضوع در محیط وب تأمین شده و اقداماتی برای کشف دانش، شبیه به داده‌های رایج (مشترک۱۰) یا متن کاوی (استخراج متن۱۱) در پایگاه‌های اطلاعاتی متنی (کتابشناختی) یا اداری (اجرایی) انجام گرفته است. از زمانی كه وب فضای اطلاعاتی كاملاً متفاوتی از سایر پایگاه‌های اطلاعاتیِ علمی یا حرفه‌ای متداول، شده است، بعضی وقت‌ها شباهت‌های مذكور ممكن است به صورت كم عمق و سطحی ظاهر گردد. برای مثال، ما با اطمینان نمی دانیم كه چرا مردم در وب به سایر صفحات پیوند می دهند.

هیچ قراردادی برای استناد در محیط وب همانند آثار علمی چاپی وجود ندارد. علاوه بر این، زمان نقش متفاوتی بر روی وب ایفا می‌نماید. از سوی دیگر، به دلیل این كه وب مجموعه‌ای است بسیار پیچیده از کلیه انواع اطلاعاتی كه به وسیله انسان های متفاوت تولید می‌شود و همچنین توسط كاربران مختلف مورد جستجو قرار می‌گیرد، موضوع جالبی برای پژوهش است، و در واقع، اطلاع‌سنجی روش‌هایی را برای شروع پژوهش در وب ارائه می‌كند. هرچند یك نفر باید با درخواست پیوسته از پایگاه‌های اطلاعاتی استنادی كنترل شده توسط مؤسسه اطلاعات علمی۱۲ آگاه شود، برای مثال، از طریق زبان دستور۱۳ پایگاه اطلاعاتی دایالوگ. گردآوری داده‌ها در محیط وب، به ویژگی‌ها و خصوصیات بازیابی موتورهای کاوش مختلف و روبات‌های وب، بستگی دارد. پیش از ظهور دستور “set posting on” در پایگاه اطلاعاتی دایالوگ۱۴ در طی دهه ۱۹۹۰، محاسبه استنادها به صورت پیوسته امكان پذیر نبود. یك نفر باید تمام مدارك استناد شده را جهت تحلیل به صورت محلی، به منظور شمارش تعداد واقعی استنادها در فضای اطلاعاتی تعریف شده به وسیله موسسه اطلاعات علمی، بارگذاری (فروفرستی) می کرد. امروزه این حالتی است كه در اكثر موتورهای وب وجود دارد كه روسو در سال‌های ۱۹۹۷ و ۱۹۹۹ آن را اثبات كرد.

این موتورها كل وب را نمایه‌سازی نمی‌كنند، همپوشانی آنها قابل توجه نیست (لارنس و گیلز، ۱۹۹۹) و ویژگی‌های بازیابی آنها برای تحلیل‌های وب‌سنجی گسترده پیوسته۱۵ بسیار ساده است. بنابراین، نمونه‌گیری بسیار مهم و حساس است، ولی اجرای آن مشكل است و پالایش آن ضروری است، به همین جهت مهندسی مجدد و پاكسازی اطلاعات در تحلیل‌های وب‌سنجی عنصری مهم است.این مقاله به برخی از پژوهش‌های اخیر كه عملكرد و پوشش موتورهای وب را به عنوان چارچوبی برای تحلیل‌های گزینشی كیفیت و محتوا مورد توجه قرار داده اند، اشاره می‌نماید و سپس ما به دنبال تحلیل سایت‌ها (پیوندها) ۱۶ مانند تحلیل «پیوند-صفحه»۱۷ در اصطلاحات روسو (۱۹۹۷) و مطالعات عامل تأثیرگذار وب هستیم. تلاش‌هایی به منظور فراهم کردن مسیرهای جدید خروجی (برون رفت) وب‌سنجی از طریق اجرای كشف دانش و ردیابی موضوع، به عنوان مثال به وسیله ساختار پیوندهای متقاطع و پیوندهای ضعیف، در نتیجه‌گیری مقاله مورد بحث قرار گرفته اند.

● پژوهش‌های كیفی و پوششی موتورهای وب

لورنس و گیلز (۱۹۹۸) مقاله‌ای بنیادی نوشتند که در آن پوشش موتورهای کاوش تجاری در محیط وب را با معرفی محتوای ‍وب قابل نمایه‌سازی»۱۸، مدنظر قرار دادند. مفهوم وب قابل نمایه‌سازی بر بخشی از وب كه می‌تواند با موتورهای کاوش نمایه شود به استثنای اسناد و مدارک پایگاه‌های اطلاعاتی، مانند دایالوگ، دلالت دارد. آزمون گسترده‌ای كه در دسامبر ۱۹۹۷ بین ۶ موتور کاوش برتر تجاری اصلی یعنی: آلتاویستا، هات بات، نورثرن لایت، اینفوسیک، لیکوس و اکسایت انجام گرفت، سطح پایینی از قابلیت نمایه‌سازی وب در حدود ۳۲۰ میلیون صفحه را نشان داد. این پژوهش همچنین نشان داد كه پوشش هر یك از موتورها به صورت قابل ملاحظه‌ای، با نمایه‌سازی یك سوم «وب قابل نمایه‌سازی» محدود شده‌است.احتمالاً دلایل زیادی برای این نتیجه‌گیری وجود دارد. به عنوان مثال، عمق و جامعیت نمایه‌سازی در خدمت دهنده۱۹‌های محلی بازدید شده به وسیله موتورهای کاوش به چگونگی سازماندهی و ساختار یك سایت، كه ممكن است خروجی بازیابی را تحت تأثیر قرار دهد بستگی دارد، همان طور كه ممكن است روش نمایه‌سازی، واژه‌های پرسش (سؤال) را تحت تأثیر قرار دهد.

برای مثال، از طریق کوتاه‌سازی تحمیلی۲۰ مدارک وبی طولانی، تلاش‌های دیگری نیز برای ارزشیابی موتورهای وب انجام شده است، مثلاً مشاهده كیفیت فهرست‌های رتبه بندی شده مدارک وب كه به وسیله موتورهای اصلی بازیابی شده‌اند (كورتوا و بری، ۱۹۹۹). در کنار سایر یافته‌ها، این مقاله در مورد دانش كم و بیش در دسترس عموم و درباره ویژگی‌های مختلف نمایه‌سازی و بازیابی كه به وسیله هر یك از موتورها استفاده شده است، بحث می‌كند. روش ارزیابی موتورهای وب به وسیله کلارک و ویلت۲۱ (۱۹۹۷) که آلتاویستا، لیکوس و اکسایت را با هم مقایسه نمودند، مطرح شده است. علاوه براین، آن مقاله، ارزیابی انتقادی از پژوهش‌های پیشین را نشان داده و روشی واقع‌بینانه و معقول را که شامل اندازه‌گیری جامعیت نسبی است، فراهم می‌كند. همچنین آن مقاله نتیجه گرفت كه آلتاویستا به صورت قابل ملاحظه‌ای بهتر از لیکوس و اکسایت عمل کرده است. اُپنهایم۲۲ و دیگران (۲۰۰۰) پژوهشی مشروح و روزآمد درباره ارزیابی موتورهای کاوش وب، شامل بحثی در باب روش‌های آزمون، فراهم نمودند. در حالی كه بسیاری از مطالعات ارزیابی و پوششی به ربط و تعداد صفحات وب در یك زمان معین توجه می‌كنند، سایر تحلیل‌های انتقادی، بازیابی پیوند- صفحه را در بر می گیرند (سیندر و رزن‌باوم، ۱۹۹۹) و یا پژوهش‌های ساختاری یا پوششی وب مبتنی بر سری‌های زمانی۲۳ را پوشش می دهند. اسنایدر و روزنبوم نیز مانند اینگورسن(۱۹۹۸) ناهماهنگی‌ها و تفاوت‌های زیادی را به ویژه در رابطه با بازیابی پیوند-صفحه موتور آلتاویستا مشاهده كردند. بی نظمی‌های آن موتور را همچنین بار- ایلان (۱۹۹۹) در یك مطالعه طولی۲۴ و نیز روسو (۱۹۹۹) كسی كه دو موتور آلتاویستا و نورثرن لایت را طی ۲۱ هفته به صورت روزانه در طی سال ۱۹۹۹ مورد مقایسه قرار داده بود، گزارش كرده‌اند.مطالعه بعدی از سه واژه مفردِ عام یکسان به عنوان پرسش (واژه‌های جستجو) در طولِ مدت ارزیابی استفاده کرد. در حالی که نورثرن لایت، همان طور که پیش‌بینی شده بود، یک افزایش ثابت و منظم از موفقیت‌های همزمان با گسترش وب را نشان می داد، آلتاویستا در شکل(فرم) بسیار ثابت و جدیدی مجدداً آغاز به کار کرد و گوناگونی و تغییرات زیادی را در طول زمان تا یک تاریخ به خصوص (۲۵ اکتبر۱۹۹۹) نشان می داد. در آن تاریخ تعداد صفحات وب بازیابی شده به طور چشمگیری همراه با این تأثیر شبه نو اختر۲۵ مبتنی بر پرسش افزایش یافت(روسو، ۱۹۹۹، ص۵).


شما در حال مطالعه صفحه 1 از یک مقاله 7 صفحه ای هستید. لطفا صفحات دیگر این مقاله را نیز مطالعه فرمایید.