یکشنبه, ۱۴ بهمن, ۱۴۰۳ / 2 February, 2025
مجله ویستا
جستوجو، کلید حل معما در اینترنت
● اشاره:
اینترنت شبكهای بسیار گسترده است و حاوی مطالب زیادی در موضوعات گوناگون. این رسانه جدید كه انقلابی در زمینه اطلاعات ایجاد كرده قرن نوین را به قرن اطلاعات بدل نموده است. اگر در گذشته یافتن مطالب مورد نیازمان احتیاج به مسافرت و یا صرف وقت زیادی داشت و سخت بود، امروزه با نشستن در پشت كامپیوتر و اتصال به شبكه جهانی اینترنت آن اطلاعات و دانش در اختیار ما قرار میگیرد. اما چگونه میتوانیم در بین این حجم اطلاعات در این رسانه مطلب مورد نظر خود را بیابیم. جستوجو كلید حل این معماست.
● ابزارهای جستوجو
همان طوركه فهرست مطالب و نمایهها ابزارهای اصلی برای دسترسی به محتوای كتابها و مجلات به شمار میروند، ابزارهای كاوش نیز جستوجو و بازیابی منابع اطلاعاتی موجود در شبكه اینترنت را تسهیل مینمایند. هر كدام از ابزارهای كاوش، محتوا، پوشش و واسط منحصر به فرد خود را دارند و برای استفاده از آنها و همچنین انجام جستوجوی موفق و مفید در آنها باید از مجموعهای از اصول و قواعد جستوجو در این ابزارها آگاه بود.
آشنایی با این ابزارها برای جستوجوگران اطلاعات در اینترنت امری ضروری میباشد و لازم است. ضمن شناسایی ابزارهای كاوش اینترنت در حوزههای مختلف، با روشهای جستوجو در آنها آشنا شده و مناسبترین آنها را برای رفع نیازهای اطلاعاتی خود انتخاب نمایند.
● ابزارهای كاوش اینترنت در یك دستهبندی كلی در دو دسته موتورهای جستوجو و راهنماهای موضوعی تقسیمبندی میشوند.
۱) راهنماهای موضوعی وب (Web Directory): راهنماهای وب یكی از مهمترین ابزارهای كاوش در اینترنت به شمار میروند كه گزینشی بوده و منابع آنها بر اساس موضوع دستهبندی شدهاند. در این ابزارها جستوجو را میتوان در ساختار موضوعی و به صورت سلسله مراتبی انجام داد.
راهنماهای وب بر خلاف موتورهای جستوجوی كلید واژهای، امكان دسترسی سریع و مناسب به اطلاعات معتبر و ارزشمند تحلیل شده را منطبق با نیازهای مخاطبان از طریق ساختار موضوعی نظاممند در اختیار قرار میدهند. در واقع نتایج جستوجو از طریق راهنماهای موضوعی در هم ریختگی كمتری دارد، زیرا منابع و وب سایتهایی كه پیدا میشوند در اغلب موارد به وسیلهٔ متخصصان موضوعی گزینش شدهاند، لذا كاربر كل شبكه وب را جستوجو نمیكند، بلكه روی طبقه موضوعی انتخاب شده به جستوجو میپردازد و از این طریق از اتلاف وقت كاربر جلوگیری میشود.
به عبارت دیگر، راهنماهای وب مجموعهای از منابع شبكه وب را در ساختار موضوعی كلی (فرضاً سلسله مراتبی یا درختی) دستهبندی كرده و آنها را در طبقه موضوعی كلی و هر طبقه را به موضوعات ریز و خاصتر تقسیم میكنند. نقطه قوت این ابزارها دقیق و مرتبط بودن نتیجه جستوجو با موضوع مورد نظر و اعتبار و كیفیت بالای منابع بازریابی شده و نقطه ضعف آنها نیز پوشش محدود منابع وب، چند مرحلهای بودن فرآیند جستوجو و همچنین پایین بودن سرعت روزآمدی منابع آنها میباشد.
۲) موتورهای جستوجو (Search Engines):
موتورهای جست وجو ابزارهایی هستند كه برای كاوش انواع منابع اطلاعاتی موجود در شبكه اینترنت طراحی شدهاند. موتورهای جستوجو با جمعآوری صفحات وب و ایجاد پایگاههای اطلاعاتی فرآیند مرور و جستوجو را برای استفادهكنندگان تسهیل میكنند. به كمك این ابزارها و از طریق كلید واژه، عبارت و سایر قابلیتها میتوان به جستوجوی اطلاعات در اینترنت پرداخت.
هر كدام از موتورهای جستوجو از برخی جنبهها با هم تفاوت دارند و نقاط قوت و ضعف و نیز گسترهٔ اطلاعات خاص خود را دارا میباشند كه باید بر اساس نیاز اطلاعاتی و نوع مدرك مورد جستوجو هر یك از این ابزارها را برای جستوجوی منابع وب انتخاب كرد. در واقع موتورهای جستوجو از نظر تنوع، محتوا و استراتژیهای جستوجو، تهیه منابع و مجموعهٔ ابزارهایی كه برای كمك به استفادهكنندگان ارائه میدهند، تفاوتها و پیچیدگیهای خاص خود را دارا هستند. از طرفی بوسیله هیچ یك از موتورهای جستوجو نمیتوان در تمام منابع اطلاعاتی موجود در اینترنت جستوجوكرد.
با تایپ واژه یا عبارت مربوط به موضوع مورد نظر خود در هر كدام از این ابزارها، همه صفحات و سایتهای مرتبط با آن موضوع بازیابی میشوند. از نقاط قوت این ابزارها میتوان به پوشش وسیع منابع وب و سرعت در روزآمدسازی منابع و از نقاط ضعف آن نیز میتوان به بازیابی بعضی منابع كم ربط یا نامربوط با موضوع مورد نظر اشاره كرد.
تفاوت اصلی این دو گروه نیز در نحوه تشکیل پایگاه داده و جمعآوری اطلاعات آنهاست. در فهرستها، این کار به عهده انسان است اما در موتورهای جستوجوگر جمعآوری اطلاعات پایگاه داده را نرمافزارها انجام میدهند. دانستن تفاوت کار این دو گروه بسیار مهم است زیرا هر یک از آنها به گونهای متفاوت رفتار مینمایند. فهرست هرگز از وجود یك سایت اطلاع نمییابد مگر زمانیکه شخصی آن را به وی معرفی نماید.
بعد از معرفی است که ویراستار آن فهرست به سایت شما مراجعه نموده، در صورت رعایت قوانین فهرست و انتخاب گروه مناسب، آن سایت را به پایگاه داده فهرست اضافه مینماید. اما در موتورهای جستوجوگر وضع به گونهای دیگر است، موتور جستوجوگر میتواند از وجود آن سایت اطلاع یابد اگر راه ورود آن فراهم شده باشد. در واقع نرمافزار موتور جستوجوگر هر لحظه در حال وبگردی و به روزرسانی اطلاع قدیمی و همین طور افزودن اطلاعات جدید به پایگاه داده موتور جستوجوگر است.
● بخشهای مختلف یك موتور جستوجو
جستوجویی در یک موتور جستوجوگر انجام و نتایج جستوجو ارائه میشود، كاربران در واقع نتیجه كار بخشهای متفاوت موتور جستوجوگر را میبینند. موتور جستوجوگر قبلا پایگاه دادهاش را آماده كرده است و این گونه نیست كه درست در همان لحظه جستوجو، تمام وب را بگردد. هیچ موتور جستوجوگری توانایی انجام این كار را ندارند. همه آنها در زمان پاسخ گویی به جستوجوهای كاربران، تنها در پایگاه دادهای كه در اختیار دارند به جستوجو میپردازند و نه در وب! موتور جستوجوگر به كمك بخشهای متفاوت خود، اطلاعات مورد نیاز را قبلا جمعآوری، تجزیه و تحلیل میكند، آن را در پایگاه دادهاش ذخیره مینماید و به هنگام جستوجوی کاربر تنها در همین پایگاه داده میگردد.
● بخشهای مجزای یك موتور جستوجوگر عبارتند از: Spider ، Crawler ، Indexer ، Database و Ranker حال هر كدام را به تفضیل بررسی میكنیم:
▪ Spider (عنکبوت): اسپایدر نرمافزاری است كه كار جمعآوری اطلاعات مورد نیاز یك موتور جستوجوگر را بر عهده دارد. اسپایدر به صفحات مختلف سر میزند، محتوای آنها را میخواند، لینکها را دنبال، اطلاعات مورد نیاز را جمعآوری و آن را در اختیار سایر بخشهای موتور جستوجوگر قرار میدهد. همانطور كه كاربران، صفحات مختلف را بازدید میكنند، اسپایدر هم درست این كار را انجام میدهد با این تفاوت كه اسپایدر كدهای HTML صفحات را میبیند اما كاربران نتیجه حاصل از كنار هم قرار گرفتن این كدها را. اسپایدر، به هنگام مشاهده صفحات، بر روی سرورها رد پا برجای میگذارد.
شما اگر اجازه دسترسی به آمار دید و بازدیدهای صورت گرفته از یک سایت و اتفاقات انجام شده در آن را داشته باشید، میتوانید مشخص كنید كه اسپایدر كدام یک از موتورهای جستوجوگر صفحات سایت را مورد بازدید قرار داده است.
▪ Crawler (خزنده): كراولر، نرمافزاری است كه به عنوان یك فرمانده برای اسپایدر عمل میكند. خزنده مشخص میكند که اسپایدر كدام صفحات را مورد بازدید قرار دهد. در واقع کراولر تصمیم میگیرد كه كدام یك از لینكهای صفحهای كه اسپایدر در حال حاضر در آن قرار دارد، دنبال شود. کراولر، ممكن است قبلا برنامهریزی شده باشد که آدرسهای خاصی را طبق برنامه، در اختیار اسپایدر قرار دهد تا از آنها دیدن کند. دنبال كردن لینكهای یک صفحه به این بستگی دارد كه موتور جستوجوگر چه حجمی از اطلاعات یک سایت را میتواند در پایگاه دادهاش ذخیره كند. همچنین ممكن است اجازه دسترسی به بعضی از صفحات به موتورهای جستوجوگر داده نشده باشد. دارنده سایت، همان طور كه دوست دارد موتورهای جستوجوگر اطلاعات سایت را با خود ببرند، میتواند آنها را از بعضی صفحات سایت دور كند و اجازه دسترسی به محتوای آن صفحات را به آنها ندهد.
▪ Indexer (بایگانی كننده): تمام اطلاعات جمعآوری شده توسط اسپایدر در اختیار ایندکسر قرار میگیرد. در این بخش اطلاعات ارسالی مورد تجزیه و تحلیل قرار میگیرند و به بخشهای متفاوتی تقسیم میشوند. تجزیه و تحلیل بدین معنی است كه مشخص میشود اطلاعات از كدام صفحه ارسال شده است، چه حجمی دارد، كلمات موجود در آن كدامند، کلمات چند بار تكرار شدهاند، كلمات در كجای صفحه قرار دارند و ... . در حقیقت ایندکسر، صفحه را به پارامترهای آن خرد میکند و تمام این پارامترها را به یک مقیاس عددی تبدیل میکند تا سیستم رتبهبندی بتواند پارامترهای صفحات مختلف را با هم مقایسه کند. در زمان تجزیه و تحلیل اطلاعات، ایندکسر برای كاهش حجم دادهها از بعضی كلمات كه بسیار رایج هستند صرفنظر میکند. كلماتی نظیر a، an، the، www، is و ... از این گونه كلمات هستند.
▪ DataBase (پایگاه داده): تمام دادههای تجزیه و تحلیل شده در ایندکسر، به پایگاه داده ارسال میگردد. در این بخش دادهها گروهبندی، كدگذاری و ذخیره میشود. همچنین دادهها قبل از آنكه ذخیره شوند، طبق تکنیکهای خاصی فشرده میشوند تا حجم كمی از پایگاه داده را اشغال كنند. یك موتور جستوجوگر باید پایگاده داده عظیمی داشته باشد و به طور مداوم حجم محتوای آنرا گسترش دهد و البته اطلاعات قدیمی را هم به روز رسانی نماید. بزرگی و به روز بودن پایگاه داده یك موتور جستوجوگر برای آن امتیاز محسوب میگردد. یكی از تفاوتهای اصلی موتورهای جستوجوگر در حجم پایگاه داده آنها و همچنین روش ذخیرهسازی دادهها در پایگاه داده است.
▪ Ranker (سیستم رتبهبندی): كاربران برای استفاده از یك موتور جستوجو چند كلمه را در جعبه جستوجوی آن وارد میكنند و سپس با فشردن Enter منتظر پــاسخ میمانند. برای پاسخگویی به درخواست کاربر، ابتدا تمام صفحات موجود در پایگاه داده كه به موضوع جستوجو شده، مرتبط هستند، مشخص میشوند. پس از آن سیستم رتبهبندی وارد عمل شده، آنها را از بیشترین ارتباط تا كمترین ارتباط مرتب میكند و به عنوان نتایج جستوجو به كاربر نمایش میدهد.
حتی اگر موتور جستوجوگر بهترین و كاملترین پایگاه داده را داشته باشد اما نتواند پاسخهای مرتبطی را ارائه كند، یك موتور جستوجوگر ضعیف خواهد بود. در حقیقت سیستم رتبهبندی قلب تپنده یك موتور جستوجوگر است و تفاوت اصلی موتورهای جستوجوگر در این بخش قرار دارد. سیستم رتبهبندی برای پاسخگویی به سوالات كاربران، پارامترهای بسیاری را در نظر میگیرد تا بتواند بهترین پاسخها را در اختیار آنها قرار دارد.
● راه ورود موتور جستوجوگر به یك سایت
موتور جستوجوگر میتواند از راههای متفاوتی به یک سایت وارد شود. این راهها همان لینکها هستند. موتور جستوجوگر برای خواندن صفحات سایت مجوزهای لازم و محدودیتها را در فایل ROBOTS.TXT بررسی میکند، هر چند که میتواند آن مجوزها را به طور کلی نادیده بگیرد. موتور جستوجوگر میتواند انواع فایل را بخواند: فایل DOC، PDF، HTML، PHP و ... شب به سایت سر بزند و یا روز. گاهی هم که به سایت سر میزند با دست خالی بر میگردد زیرا سرور سایت جواب نمیدهد و سایت موقتا و یا برای همیشه فعال نیست.
اگر میخواهید موتور جستوجوگر را به میهمانی سایتتان دعوت کنید باید راه را هم به وی نشان دهید و وی آدرس سایت شما را بداند. موتور جستوجوگر بهانههای بسیاری برای نپذیرفتن این دعوت دارد زیرا در همان لحظه به سایتهای بسیار دیگری هم دعوت شده است! بنابراین باید در آدرس دادن نهایت دقت را انجام دهید. پیوندی هم که شما با آن موتور جستوجوگر را به سایتتان دعوت میکنید، بسیار مهم است. همواره پیوند به سایتتان را در سایت (صفحات) مهم دیگر قرار دهید تا موتور جستوجوگر نه یکبار که چندین بار به سایت شما از آن طریق مراجعه کند.
موتور جستوجوگر، کافیست که آدرس سایت شما را یاد بگیرد. آن وقت میتوانید مطمئن باشید که هر ماه حداقل یکبار بدان مراجعه میکند. اما اگر پیوندهای سایتتان در سایتهای معتبر و مهمی باشند آن وقت بیش از یک بار در ماه و حتی هر چند روز یک بار بدان مراجعه میکند. پیوند دادن و پیوند گرفتن امروزه مقولهای بسیار جدی میان مدیران سایتهاست. شاید هر روزه میلیونها پست الکترونیک فقط برای این موضوع میان مدیران سایتها رد و بدل میشود
مهدی رودكی
منبع : روزنامه تفاهم
ایران مسعود پزشکیان دولت چهاردهم پزشکیان مجلس شورای اسلامی محمدرضا عارف دولت مجلس کابینه دولت چهاردهم اسماعیل هنیه کابینه پزشکیان محمدجواد ظریف
پیاده روی اربعین تهران عراق پلیس تصادف هواشناسی شهرداری تهران سرقت بازنشستگان قتل آموزش و پرورش دستگیری
ایران خودرو خودرو وام قیمت طلا قیمت دلار قیمت خودرو بانک مرکزی برق بازار خودرو بورس بازار سرمایه قیمت سکه
میراث فرهنگی میدان آزادی سینما رهبر انقلاب بیتا فرهی وزارت فرهنگ و ارشاد اسلامی سینمای ایران تلویزیون کتاب تئاتر موسیقی
وزارت علوم تحقیقات و فناوری آزمون
رژیم صهیونیستی غزه روسیه حماس آمریکا فلسطین جنگ غزه اوکراین حزب الله لبنان دونالد ترامپ طوفان الاقصی ترکیه
پرسپولیس فوتبال ذوب آهن لیگ برتر استقلال لیگ برتر ایران المپیک المپیک 2024 پاریس رئال مادرید لیگ برتر فوتبال ایران مهدی تاج باشگاه پرسپولیس
هوش مصنوعی فناوری سامسونگ ایلان ماسک گوگل تلگرام گوشی ستار هاشمی مریخ روزنامه
فشار خون آلزایمر رژیم غذایی مغز دیابت چاقی افسردگی سلامت پوست