شنبه, ۲۶ خرداد, ۱۴۰۳ / 15 June, 2024
مجله ویستا

نکاتی که باید برای استفاده از اینترنت در انجام تحقیقات مورد توجه قرار داد


نکاتی که باید برای استفاده از اینترنت در انجام تحقیقات مورد توجه قرار داد
اینترنت یک رسانه شخصی است نه یک کتابخانه که کتب و نشریات موجود در آن توسط متخصصین ارزیابی و انتخاب شده باشد. در واقع، می توان همه گونه اطلاعات را روی اینترنت یافت: از دقیق ترین و مستندترین گرفته تا مطالب واهی و غیرقابل استناد. بنابراین، برای استفاده از منابع موجود روی اینترنت در امور تحقیقاتی، همه چیز باید ابتدا مورد ارزیابی قرار گیرد و از صحت و اعتبار آن اطمینان حاصل گردد.
هنگامی که در مورد یک موضوع روی اینترنت تحقیق می کنید، حتما" به تعداد زیادی سایت مراجعه کنید و به هیچ وجه به مطالب یافت شده در یک سایت یا یک نوع سایت اکتفا ننمایید.
سه منبع اصلی برای یافتن مطالب مورد علاقه روی اینترنت عبارتند از لیست موضوعات، موتورهای جستجو و دیپ وب. البته باید توجه داشت که هریک از سه منبع فوق برای یک نوع جستجو مناسب است و شما باید ابتدا تفاوت هریک از آنها و موارد کاربرد آنها را بخوبی بدانید.
● لیست موضوعات
برای جستجوهای عمومی و درصورت تمایل به مشاهده سایتهایی توصیه شده توسط اهل فن، می توان از لیستهای موضوعات استفاده کرد.
▪ تعریف:
لیست موضوعات سرویسی است که مجموعه ای از لینکها به منابع موجود روی وب در زمینه مورد علاقه کاربر را در اختیار وی می گذارد. این لیستها توسط طراحان سایتها یا ارزشیابها بر اساس موضوع سازماندهی و طبقه بندی شده اند. برای پذیرش یک لینک به لیست موضوعات، معیارها و شرایط خاصی وجود دارد اما این معیارها و شرایط برای لیست های موضوعات مختلف، متفاوت است. بیشتر لیستها دارای قابلیت جستجو هستند.
هنگام استفاده از لیستهای موضوعی به خاطر داشته باشید که:
دو نوع لیست موضوعات وجود دارد: لیستهای دانشگاهی و تخصصی که غالبا" توسط متخصصین موضوعات مربوطه و به منظور پاسخگویی به نیازهای محققین ایجاد و اداره می شوند، و لیستهایی که بصورت تجاری عمل می کنند، مخاطبینشان عموم مردم و هدفشان جذب هرچه بیشتر مراجعین می باشد. بنابراین دقت کنید که از لیست موضوعی مناسب با نیازتان استفاده کنید.
ضوابط پذیرش سایتها در لیستهای موضوعی مختلف بسیار متفاوت است. بنابراین بهتر است قبل از استفاده از یک لیست موضوعات، ابتدا سیاستهای آن و معیارهای پذیرش سایتها در آن لیست را مورد توجه قرار دهید. مشکلی که در این زمینه وجود دارد این است که همه لیستهای موضوعات، تمام سیاستها و نام و تخصص تأیید کنندگان سایتهای خود را اعلام نمی کنند. این مسئله بخصوص در مورد لیستهای موضوعات تجاری صادق است.
بسیاری از مردم از لیستهای موضوعات استفاده کافی نمی کنند و مستقیما" به سراغ موتورهای جستجو می روند. توجه داشته باشید که لیستهای موضوعات دانشگاهی دربرگیرنده مجموعه های بدقت انتخاب شده ای از سایتهای با کیفیت بالا هستند. اگر به دنبال سایتهای پرکیفیت می گردید، لیستهای موضوعات را فراموش نکنید. INFOMINE از دانشگاه کالیفرنیا مثال خوبی برای لیستهای موضوعات دانشگاهی و Yahoo! مثال خوبی برای لیستهای موضوعات تجاری است. توجه داشته باشید که هیچگاه از یاهو یا لیستهای موضوعات تجاری مشابه در تحقیقات جدی و مهم استفاده نکنید. فهرست کاملتری از هر دو نوع لیستهای موضوعات را می توانید اینجا بیابید.
● موتور جستجو
برای جستجوهای هدفمند، پیچیده و در بعضی موارد جستجوهای کلی از موتورهای جستجو استفاده می شود.
▪ تعریف:
یک موتور جستجو پایگاه اطلاعاتی قابل جستجویی از فایلهایی است که توسط یک برنامه کامپیوتری (که سرگردان، خزنده، روبات، کرم یا عنکبوت خوانده می شود) ایجاد شده است. کلیدسازی بر اساس اطلاعات جمع آوری شده در مورد فایلها صورت می گیرد مانند عنوان، متن کامل، اندازه، URL و غیره. هیچگونه معیار ویا ضابطه خاصی برای پذیرش سایتها در موتورهای جستجو وجود ندارد هرچند که طریق ترتیب نمایش نتایج می تواند نشاندهنده نوعی ارزیابی سایتها باشد.
موتور جستجو که شاید بهتر باشد بگوییم سرویس موتور جستجو یا سرویس جستجو شامل سه بخش است:
ـ عنکبوت: برنامه ای که بر روی شبکه وب از یک لینک به لینک دیگر رفته و صفحات را شناسایی کرده و می خواند.
ـ ایندکس: پایگاه اطلاعاتی شامل یک کپی از تمام صفحات وبی است که توسط عنکبوت خوانده شده است.
ـ مکانیزم موتور جستجو: مکانیزمی است که به کاربران امکان جستجو در ایندکس را می دهد و معمولا" نتایج را بر اساس میزان تطابق با موضوع مورد علاقه کاربر مرتب کرده، نمایش می دهد.
HotBot مثال خوبی برای موتورهای جستجو می باشد. در آخر، لیست کاملتری از موتورهای جستجو آمده است.
● دیپ وب
برای جستجوهای هدفمند، و زمانی که شما بدنبال اطلاعات غیرمتنی هستید از دیپ وب استفاده کنید.
اخیرا" در رسانه ها اصطلاح دیپ و ب یا وب نامرئی زیاد مشاهده می شود. امروزه وب به یک مجموعه پیچیده تبدیل شده است که دربرگیرنده حیطه وسیعی از انواع مختلف و متنوع اطلاعات است. این اطلاعات بسیار بیشتر از آنچه که در صفحات ثابت وب قابل رؤیتند هستند. بعضی از مردم به دلایلی که در زیر با آن آشنا می شوید، به اشتباه به این بخش از وب «وب نامرئی» می گویند.
وقتی به دیپ وب اشاره می شود، منظور موارد زیر است:
محتویات پایگاههای اطلاعاتی قابل دسترسی بر روی وب پایگاههای اطلاعاتی دربردارنده اطلاعاتی هستند که در جداولی که با برنامه هایی مانند اکسس، اوراکل، اس کیو ال سرور و دی بی تو ساخته شده اند ذخیره گردیده اند. اطلاعات ذخیره شده در این پایگاههای اطلاعاتی تنها از طریق جستجوی این پایگاهها قابل استحصال هستند و بنابراین، این اطلاعات با صفحات وب معمولی که بصورت اسنادی با امکان دسترسی مستقیم هستند، متفاوتند.
این پایگاههای اطلاعاتی معمولا" یک موضوع مشخص ویا جنبه خاصی از یک موضوع مشخص را دربر می گیرند. عنکبوتهای موتورهای جستجو از ایندکس کردن اینگونه اطلاعات عاجزند.حجم قابل توجهی از اطلاعات با ارزش روی وب توسط این پایگاههای اطلاعاتی ارائه می شوند. درواقع، تخمین زده می شود که حجم اطلاعات موجود در این پایگاهها، پانصد برابر اطلاعات موجود در صفحات وب معمولی باشد.
فایل های غیر متنی مانند فایل های چند رسانه ای، فایلهای گرافیکی، نرم افزار و اسنادی با فرمتهای غیر استاندارد مانند اسناد با فرمت pdf. بسیاری از سرویس دهندگان جستجو برای یافتن اینگونه فایلها گزینه های جستجوی مجزایی ارائه می کنند. آلتاویستا، اگزایت، هات بات و لیکاس تنها چند نمونه از سرویس دهندگان جستجویی هستند که برای جستجوی فایلهای چندرسانه ای و تصاویر و ... مکانیزمهای جستجوی مجزایی درنظر گرفته اند در حالی که گوگل، در قسمت جستجوی عمومی، فایلهای از نوع PDF را نیز مورد جستجو قرار می دهد.
صحبت در مورد پایگاههای اطلاعاتی روی وب قدمتی چند ساله دارد و پیش از رواج اصطلاحاتی مانند وب نامرئی یا دیپ وب، گاهی اوقات از آن با عناوینی چون پایگاههای اطلاعاتی تخصصی، پایگاههای اطلاعاتی با موضوع مشخص، کتابخانه های مجازی و سایر عناوین مشابه نام برده می شد. با توسعه تکنولوژی وب و با افزایش حجم اطلاعات انباشته شده در این پایگاههای اطلاعاتی روی وب، اهمیت این پایگاهها، بعنوان ابزارهای کسب اطلاعات بصورت روزافزون افزایش می یابد.
چرا از اصطلاح «وب نامرئی» استفاده می شود؟ علت در این امر نهفته است که محتویات پایگاههای اطلاعاتی معمولا" در نتایج جستجوی موتورهای جستجو نشان داده نمی شوند زیرا عنکبوتهای موترهای جستجو نمی توانند وارد جداول اطلاعاتی این پایگاهها شوند. بنابراین، محتویات این پایگاهها برای آنها «نامرئی» است.
▪ اما به دلایل زیر، اصطلاح «وب نامرئی» انتخاب مناسبی نیست:
۱) در این اصطلاح، تنها از دید موتورهای جستجو به پایگاههای اطلاعات نگریسته شده و اینگونه فرض شده که تنها راه کسب اطلاعات روی وب، استفاده از موتورهای جستجو می باشد. در حالی که در عمل چنین نیست.
۲) هیچ اطلاعات ثبت شده ای نامرئی نیست. ممکن است که دستیابی به برخی اطلاعات مشکل تر از اطلاعات دیگر باشد، اما این به معنای نامرئی بودن آن اطلاعات نیست.
۳) سالهاست که از پایگاههای اطلاعاتی استفاده می شود. بسیاری از ما با مجموعه CD-ROM های موجود در کتابخانه ها یا پایگاههای اطلاعاتی تحت وب آشنا هستیم و از کاتالوگ های کتابخانه ها روی وب استفاده می کنیم. هیچگاه کسی این بخش از اطلاعات کتابخانه ها را «کتابخانه نامرئی» ننامیده است. اینها فقط پایگاههای اطلاعاتی هستند که برای استفاده از اطلاعاتشان کاربر می بایست در آنها بگردد. درست مانند یک کتابخانه، وب هم دربرگیرنده انواع مختلف اطلاعات است که بصورت های متفاوت ذخیره شده و قابل دستیابی است.
یک کمپانی با نام BrightPlanetاصطلاح "deep Web" را برای پایگاههای اطلاعاتی قابل جستجو روی وب ابداع نموده است که بسیار بهتر است زیرا اطلاعات موجود در پایگاههای اطلاعاتی روی وب با استفاده از ابزار و تکنولوژی مناسب جستجو قابل دستیابی و "مرئی" خواهند بود. هچنین بر این اساس، صفحات وب معمولی با عنوان "surface Web" یا "وب سطحی" خوانده می شوند.
▪ هنگام کار با دیپ وب، به این نکات توجه داشته باشید:
یک دایرکتوری خوب، دارای لینکهایی به سایتهای دارای پایگاه اطلاعات می باشد.
وب سایتهایی وجود دارند که به طور تخصصی به گرد آوری آدرس پایگاههای اطلاعاتی قابل دسترسی روی وب می پردازند. یکی از این سایتها اینویزیبل وب می باشد که لینکهایی به بیش از ده هزار پایگاه اطلاعاتی روی وب دارد. اسامی سایر سایتهای مشابه نیز در آخر آمده است.
تنوع موضوعی لینکهای موجود در سایت اینویزیبل وب بسیار زیاد است که این خود به نوعی مشکل ساز است زیرا تفکیک سایتهارا مشکل می سازد. علاوه براین، چون سایتهای موجود روی وب هم از نظر کمی و هم از نظر کیفی مرتبا" درحال رشد، تغییر و دگرگونی هستند، سایتهایی که در زیرگروه های مشخص طبقه بندی شده اند، دائما" تغییر می کنند.
اطلاعاتی که به طور پیوسته در حال تغییرند مانند اخبار، فرصتهای شغلی، پروازهای خطوط هوایی و امثال آن، از طریق دیپ وب قابل جستجو هستند.
دایرکتوریها (لیستها) بخشی از دیپ وب را تشکیل می دهند. مثلا" می توانید راهنمای تلفن، راهنمای یافتن افراد روی وب، راهنمای نام ونشانی متخصصین نظیر پزشکان و وکلا، راهنمای حقوق مؤلفین، دیکشنریها و فرهنگنامه ها، اطلاعات مربوط به شرکتها و بسیاری موضوعات دیگر را در دیپ وب بیابید.
هرچند یاهو! یکی از محبوبترین سایتهای وب و یکی از بزرگترین لیستهای موضوعی تجاری روی وب است، اما به دلایل زیر، یک منبع قابل اعتماد یا ابزاری مناسب برای امور پژوهشی نیست و به هیچ وجه نباید برای این منظور به کار رود:
یاهو! هرگونه سایتی را که در آن ثبت کنند، به مراجعین ارائه می نماید.
کارکنان سایت یاهو! پیش از اضافه نمودن نام یک سایت به لیست خود، مطالب موجود در آن را به دقت مورد بررسی قرار نمی دهند بنابراین، آدرس سایتهای علمی و دانشگاهی بدون هیچگونه تفکیکی در بین سایتها دیگر به مراجعین ارائه می شود.
یاهو تنها صفحه اول هر سایت را ایندکس می کند. بنابراین، چنانچه اطلاعات مورد علاقه ما روی صفحات دیگر سایت باشند، آنها را در نتیجه جستجو نشان نمی دهد.
ادیتورهای یاهو! وقت کافی برای مرور همه سایتهای ثبت شده در آن را ندارند بنابراین، بسیاری از سایتها یا به لیستهای یاهو اصافه نمی شوند ویا اینکه معمولا" این عمل با چندین ماه تأخیر صورت می گیرد.
هنگام استفاده از یک موتور جستجو روی وب، دانستن اصول منطقی جستجوی بولین می تواند بسیار مفید باشد. این منطق جستجو به سه شیوه مختلف در موتورهای جستجوی روی وب مشاهده می شود. برای کسب اطلاعات بیشتر، به جستجوی بولین روی وب مراجعه کنید.
منبع : فکر نو