شنبه, ۲۰ بهمن, ۱۴۰۳ / 8 February, 2025
مجله ویستا

وب نامرئی


افزایش روز افزون منابع اطلاعاتی در اینترنت و مشكلات فنی و غیرفنی موتورهای كاوش باعث شده حجم زیادی از این اطلاعات از دید كاربران پنهان بماند و به عنوان وب نامرئی مورد بحث بسیاری از متخصصان اطلاع رسانی قرار گیرد امروزه گرایش بسیاری از كتابخانه ها و مراكز اطلاع رسانی و محققان به دیجیتالی كردن منابع و قراردادن آن ها در محیط اینترنت می باشد

افزایش روز افزون منابع اطلاعاتی در اینترنت و مشكلات فنی و غیرفنی موتورهای كاوش باعث شده حجم زیادی از این اطلاعات از دید كاربران پنهان بماند و به عنوان وب نامرئی مورد بحث بسیاری از متخصصان اطلاع‌رسانی قرار گیرد. امروزه گرایش بسیاری از كتابخانه‌ها و مراكز اطلاع‌رسانی و محققان به دیجیتالی‌كردن منابع و قراردادن آن‌ها در محیط اینترنت می‌باشد. بعلاوه، بسیاری از این منابع تك‌نسخه هستند و چنانچه دسترسی مطلوب به منابع ذخیره‌شده در اینترنت ممكن نباشد بسیاری از میراث‌های علمی، پژوهشی، فكری و فرهنگی بشر به هیچ وجه مورد استفاده حال و آینده قرار نخواهد گرفت. در این میان كتابداران و اطلاع‌رسانان نیز با افزایش آگاهی كاربران از وجود وب نامرئی و شیوه‌های دستیابی و اطلاع‌یابی كاربران در باب این اطلاعات، ‌می‌توانند نقش مهمی را در كاستن سطح اطلاعات نامرئی بر عهده بگیرند . دراین مقاله تلاش شده است مفهوم وب پنهان چه از دید فنی و چه از دید كاربرمدار باز شود و در پایان نیز نقش كتابداران و اطلاع‌رسانان و راه‌های دستیابی به این اطلاعات بیان شوند.افزایش روز افزون منابع اطلاعاتی و نیاز شدید افراد در دسترسی به این اطلاعات در سراسر دنیا از یك سو و در دنیای شگفت‌انگیز ارتباطات رایانه‌ای از سوی دیگر، موجب پیدایش شبكه جهانی اینترنت در اواخر دهه ۱۹۶۰ گردید (اردلان، ۱۳۸۲)؛ ولی تا سال ۱۹۹۰ هیچگونه ابزاری برای كاوش اطلاعات موجود در آن وجود نداشت. در سال ۱۹۹۰ شبكهٔ‌ جهانی وب در «آزمایشگاه فیزیك ذره‌ای اروپا[۱]» واقع در سوئیس توسط «تیم برنرزلی» ابداع شد. پس از ابداع شبكه جهانی وب، ابزارها و موتورهای كاوش نیز پا به عرصه ظهور نهادند. در سال ۱۹۹۰ اولین ابزار كاوش توسط «آلان امتیج» در دانشگاه «مك گیل» با عنوان «آركی» ابداع شد (اردلان، ۱۳۸۲). «آركی» از طریق نمایه‌سازی فایل‌های موجود در سایت‌های اف‌تی‌پی (پروتكل انتقال فایل)، امكان جستجو و بازیابی فایل‌ها در محیط اینترنت را فراهم ساخت. برای سهولت جستجو و دسترسی به اطلاعات در اینترنت، امكاناتی به نام موتورهای كاوش در اینترنت ابداع شدند. اما با وجود پیشرفت‌ها و تحولات در حوزهٔ‌ ذخیرهٔ‌ اطلاعات در اینترنت كه یكی از امتیازات بارز این پدیدهٔ‌ جدید می‌باشد، باید یادآور شد كه ذخیرهٔ‌ اطلاعات به تنهایی كافی نیست. قطعاً اطلاعات تولیدشده زمانی ارزش واقعی می‌یابد كه مورد استفاده قرار گیرد. مشكلات موجود در زمینهٔ‌ جستجو و بازیابی اطلاعات در اینترنت باعث شده كه حجم زیادی از اطلاعات ذخیره‌شده در آن، قابل دسترس نباشد(Sherman and price, ۱۹۹۹) . به موازات گسترش ابزارهای كاوش، پژوهش دربارهٔ‌ جنبه‌های مختلف این موتور نیز شروع شد. بیشترین مباحث مطرح شده، موضوع دامنهٔ‌ كاوش و میزان سودمندی و كارآیی موتورهای كاوش بوده، كه در این خصوص بحث‌های زیادی نیز صورت گرفته. اما از موضوعاتی كه كمتر مورد توجه قرار گرفته موضوع وب نامرئی می‌باشد. از آنجا كه بین وب نامرئی و موتورهای كاوش در اینترنت ارتباط تنگاتنگی وجود دارد، لازم است نخست اشارهٔ‌ مختصری به سازوكار موتورهای كاوش كنیم.

سازوكار موتورهای كاوش

موتورهای كاوش،‌ نرم‌افزارهای كاربردی هستند كه برای جستجوی منابع اطلاعاتی در اینترنت و اینترانت‌ها مورد استفاده قرار می‌گیرند. (ابراهیمی، ۱۳۸۰) این نرم‌افزارهای كاربردی، تحت شبكه و در محیط وب قابل دسترس هستند و بر اساس كلیدواژه‌ها و عبارات مورد نظر،‌ جستجو را بر روی یك پایگاه اطلاعاتی انجام می‌دهند و نتیجه را همراه با پیوندهایی به اصل موضوع ارائه می‌كنند. این موتورهای جستجو با هدف سهولت دسترسی به اطلاعات ابداع گردیدند و به عنوان پایگاه اطلاعاتی، از ساختار محتوایی نوینی نسبت به پایگاه‌های اطلاعاتی سنتی برخوردارند. این در حالی‌ است كه تحقیقات دانشگاهی بسیاری در زمینه ابزارهای كاوش در اینترنت صورت گرفته یا در حال انجام است(كوشا، ۱۳۸۲). اگرچه ابزارهای كاوش حجم بسیار بالایی از اطلاعات (صفحات وب) را در پایگاه‌های خود نمایه و با سرعت بالایی بازیابی می‌كنند، اما این پرسش مطرح می‌شود كه آیا همه اطلاعات موجود در وب توسط این ابزارها قابل بازیابی است؟ تقریباً همه ابزارهای كاوش خود را بهترین،‌ كارآمدترین و قدرتمندترین وسیله برای جستجو و بازیابی اطلاعات در محیط وب معرفی می‌كنند، اما تحقیقات نشان می‌دهند كه بهترین موتورهای جستجو فقط ۱۶% از اطلاعات موجود بر روی وب را به كاربران عرضه می‌كنند (منصوریان، ۱۳۸۲). دلایل متعددی در این زمینه وجود دارند كه بخشی از این مشكلات و دشواری‌ها به حجم عظیم و روز افزون اطلاعات موجود در اینترنت مربوط می‌شود. بخش دیگر به میزان مهارت‌های اطلاع‌یابی كاربران و تجربه آنان در كاوش برمی‌گردد و بخش دیگر نیز به دلیل وجود وب نامرئی یا وب پنهان می‌باشد كه موتورهای كاوش، به دلایلی كه در این مقاله شرح خواهم داد قادر به انجام عمل بازیابی در آن نیستند.

بخش‌های مختلف موتورهای كاوش

۱. عنكبوت [۲]

عنكبوت با وارسی و پویش صفحه‌‌های وب، پیوند[۳]های موجود در هر صفحه به دیگر صفحات مربوط به آن صفحه‌ را دنبال می‌كند . این روبات‌ها معمولاً هرچند وقت یك‌بار در اینترنت به جستجوی صفحات وب و ارتباط آن‌ها با صفحات دیگر می‌پردازند و در پایان، آنچه را پیدا كرده‌اند به نمایه می‌افزایند. گستردگی و عمق دسترسی به اطلاعات در هر موتور جستجو، بیش از هر چیز به ویژگی‌های نرم‌افزار خزنده آن بستگی دارد.

۲. نمایه[۴]

یك پایگاه اطلاعاتی است كه اطلاعات نمایه‌سازی‌شده و‌ مرتبط با صفحات یا سایت‌های وب در آنجا نگهداری می‌شود و قابل بازیابی است. ساختار نمایه، ‌اندازه و حجم آن در موتورهای جستجو متفاوت است؛ به همین دلیل جستجو با كلیدواژه‌های یكسان در موتورهای گوناگون، نتایج نسبتاً متفاوتی را در پی خواهد داشت‌.

۳. نرم افزار جستجو در نمایه [۵]

برنامه‌ای است كه در بین میلیون‌ها صفحه نمایه‌شده موجود در یك موتور جستجو، مطابق با پرسش جستجوگر و استراتژی‌های جستجو عمل می‌كند و اطلاعاتی را كه با موضوع مرتبط باشد بازیابی می‌كند و نمایش می‌دهد.

وب نامرئی [۶]

با بررسی فرهنگ‌ها و دائرهٔ‌المعارف‌ها هیچگونه تعریفی برای این اصطلاح یافت نشد(sherman and price, ۱۹۹۹). مرور نوشتارها حاكی از آن است كه به احتمال قریب به یقین عبارت «وب نامرئی» نخستین بار درسال ۱۹۹۴ توسط «ژیل السورث»[۷] ابداع شده است. البته معدودی از منابع نیز شخص دیگری به نام «متیوكل[۸]» را به عنوان مبدع این اصطلاح معرفی می‌كنند (منصوریان، ۱۳۸۲). وب نامرئی به بخشی از فضای شبكه وب اطلاق می‌شود كه توسط روبات‌های موتورهای كاوش قابل دسترسی و شناسایی نیست و به همین دلیل در پایگاه اطلاعاتی آن‌ها وارد نمی‌شود، مثل صفحاتی كه برای دسترسی به آن‌ها نیاز به گذرواژه[۹] می‌باشد، یا فایل‌های دیداری و شنیداری و تصاویر. «شرمن» و «پرایس» به طور خلاصه وب نامرئی را این چنین تعریف نمودند: «وب پنهان آن بخش از فضای شبكه جهانگستر وب می‌باشد كه عمدتاً شامل منابع اطلاعاتی غیرمتنی و پویایی است كه به هر دلیل، به طور موقت یا دائم خارج از حوزه جستجو و بازیابی موتورهای كاوش قرار دارند و بازیابی اطلاعات موجود در آن از طریق استفاده مستقیم از این موتورها میسر نمی‌باشد. امكان بازیابی منابع پنهان در وب نامرئی، یا برای موتورهای كاوش از نظر فنی میسر نیست، یا محدودیت‌های مالی مانع از نمایه‌سازی این منابع شده است.»‌در خصوص وب نامرئی كلماتی نظیر وب پنهان[۱۰]،‌ وب عمیق[۱۱]، وب تاریك[۱۲]، بطور مترادف در متون مختلف به كار برده شده‌اند. اما این‌ها در حقیقت معادل یكدیگر نیستند و هر یك به جنبه‌ای از نامرئی بودن اشاره می‌كنند.


شما در حال مطالعه صفحه 1 از یک مقاله 4 صفحه ای هستید. لطفا صفحات دیگر این مقاله را نیز مطالعه فرمایید.