جمعه, ۱۴ دی, ۱۴۰۳ / 3 January, 2025
مجله ویستا
جستوجو، کلید حل معماها در اینترنت
اگر در گذشته یافتن مطالب مورد نیازمان احتیاج به مسافرت و یا صرف وقت زیادی داشت و سخت بود،
امروزه با نشستن در پشت کامپیوتر و اتصال به شبکه جهانی اینترنت آن اطلاعات و دانش در اختیار ما قرار میگیرد. چگونه؟ جستوجو کلید حل این معماست.
● جستوجو، کلید حل معما در اینترنت
اینترنت شبکهای بسیار گسترده است و حاوی مطالب زیادی در موضوعات گوناگون. این رسانه جدید که انقلابی در زمینه اطلاعات ایجاد کرده قرن نوین را به قرن اطلاعات بدل نموده است. اگر در گذشته یافتن مطالب مورد نیازمان احتیاج به مسافرت و یا صرف وقت زیادی داشت و سخت بود، امروزه با نشستن در پشت کامپیوتر و اتصال به شبکه جهانی اینترنت آن اطلاعات و دانش در اختیار ما قرار میگیرد. اما چگونه میتوانیم در بین این حجم اطلاعات در این رسانه مطلب مورد نظر خود را بیابیم. جستوجو کلید حل این معماست.
● ابزارهای جستوجو
همان طورکه فهرست مطالب و نمایهها ابزارهای اصلی برای دسترسی به محتوای کتابها و مجلات به شمار میروند، ابزارهای کاوش نیز جستوجو و بازیابی منابع اطلاعاتی موجود در شبکه اینترنت را تسهیل مینمایند. هر کدام از ابزارهای کاوش، محتوا، پوشش و واسط منحصر به فرد خود را دارند و برای استفاده از آنها و همچنین انجام جستوجوی موفق و مفید در آنها باید از مجموعهای از اصول و قواعد جستوجو در این ابزارها آگاه بود.
آشنایی با این ابزارها برای جستوجوگران اطلاعات در اینترنت امری ضروری میباشد و لازم است. ضمن شناسایی ابزارهای کاوش اینترنت در حوزههای مختلف، با روشهای جستوجو در آنها آشنا شده و مناسبترین آنها را برای رفع نیازهای اطلاعاتی خود انتخاب نمایند. ابزارهای کاوش اینترنت در یک دستهبندی کلی در دو دسته موتورهای جستوجو و راهنماهای موضوعی تقسیمبندی میشوند.
▪ راهنماهای موضوعی وب (Web Directory): راهنماهای وب یکی از مهمترین ابزارهای کاوش در اینترنت به شمار میروند که گزینشی بوده و منابع آنها بر اساس موضوع دستهبندی شدهاند. در این ابزارها جستوجو را میتوان در ساختار موضوعی و به صورت سلسله مراتبی انجام داد.
راهنماهای وب بر خلاف موتورهای جستوجوی کلید واژهای، امکان دسترسی سریع و مناسب به اطلاعات معتبر و ارزشمند تحلیل شده را منطبق با نیازهای مخاطبان از طریق ساختار موضوعی نظاممند در اختیار قرار میدهند. در واقع نتایج جستوجو از طریق راهنماهای موضوعی در هم ریختگی کمتری دارد، زیرا منابع و وب سایتهایی که پیدا میشوند در اغلب موارد به وسیلة متخصصان موضوعی گزینش شدهاند، لذا کاربر کل شبکه وب را جستوجو نمیکند، بلکه روی طبقه موضوعی انتخاب شده به جستوجو میپردازد و از این طریق از اتلاف وقت کاربر جلوگیری میشود.
به عبارت دیگر، راهنماهای وب مجموعهای از منابع شبکه وب را در ساختار موضوعی کلی (فرضاً سلسله مراتبی یا درختی) دستهبندی کرده و آنها را در طبقه موضوعی کلی و هر طبقه را به موضوعات ریز و خاصتر تقسیم میکنند. نقطه قوت این ابزارها دقیق و مرتبط بودن نتیجه جستوجو با موضوع مورد نظر و اعتبار و کیفیت بالای منابع بازریابی شده و نقطه ضعف آنها نیز پوشش محدود منابع وب، چند مرحلهای بودن فرآیند جستوجو و همچنین پایین بودن سرعت روزآمدی منابع آنها میباشد.
▪ موتورهای جستوجو (Search Engines): موتورهای جست وجو ابزارهایی هستند که برای کاوش انواع منابع اطلاعاتی موجود در شبکه اینترنت طراحی شدهاند. موتورهای جستوجو با جمعآوری صفحات وب و ایجاد پایگاههای اطلاعاتی فرآیند مرور و جستوجو را برای استفادهکنندگان تسهیل میکنند. به کمک این ابزارها و از طریق کلید واژه، عبارت و سایر قابلیتها میتوان به جستوجوی اطلاعات در اینترنت پرداخت.
هر کدام از موتورهای جستوجو از برخی جنبهها با هم تفاوت دارند و نقاط قوت و ضعف و نیز گسترة اطلاعات خاص خود را دارا میباشند که باید بر اساس نیاز اطلاعاتی و نوع مدرک مورد جستوجو هر یک از این ابزارها را برای جستوجوی منابع وب انتخاب کرد. در واقع موتورهای جستوجو از نظر تنوع، محتوا و استراتژیهای جستوجو، تهیه منابع و مجموعة ابزارهایی که برای کمک به استفادهکنندگان ارائه میدهند، تفاوتها و پیچیدگیهای خاص خود را دارا هستند. از طرفی بوسیله هیچ یک از موتورهای جستوجو نمیتوان در تمام منابع اطلاعاتی موجود در اینترنت جستوجوکرد.
با تایپ واژه یا عبارت مربوط به موضوع مورد نظر خود در هر کدام از این ابزارها، همه صفحات و سایتهای مرتبط با آن موضوع بازیابی میشوند. از نقاط قوت این ابزارها میتوان به پوشش وسیع منابع وب و سرعت در روزآمدسازی منابع و از نقاط ضعف آن نیز میتوان به بازیابی بعضی منابع کم ربط یا نامربوط با موضوع مورد نظر اشاره کرد.
تفاوت اصلی این دو گروه نیز در نحوه تشکیل پایگاه داده و جمعآوری اطلاعات آنهاست. در فهرستها، این کار به عهده انسان است اما در موتورهای جستوجوگر جمعآوری اطلاعات پایگاه داده را نرمافزارها انجام میدهند. دانستن تفاوت کار این دو گروه بسیار مهم است زیرا هر یک از آنها به گونهای متفاوت رفتار مینمایند. فهرست هرگز از وجود یک سایت اطلاع نمییابد مگر زمانیکه شخصی آن را به وی معرفی نماید.
بعد از معرفی است که ویراستار آن فهرست به سایت شما مراجعه نموده، در صورت رعایت قوانین فهرست و انتخاب گروه مناسب، آن سایت را به پایگاه داده فهرست اضافه مینماید. اما در موتورهای جستوجوگر وضع به گونهای دیگر است، موتور جستوجوگر میتواند از وجود آن سایت اطلاع یابد اگر راه ورود آن فراهم شده باشد. در واقع نرمافزار موتور جستوجوگر هر لحظه در حال وبگردی و به روزرسانی اطلاع قدیمی و همین طور افزودن اطلاعات جدید به پایگاه داده موتور جستوجوگر است.
● بخشهای مختلف یک موتور جستوجو
جستوجویی در یک موتور جستوجوگر انجام و نتایج جستوجو ارائه میشود، کاربران در واقع نتیجه کار بخشهای متفاوت موتور جستوجوگر را میبینند. موتور جستوجوگر قبلا پایگاه دادهاش را آماده کرده است و این گونه نیست که درست در همان لحظه جستوجو، تمام وب را بگردد. هیچ موتور جستوجوگری توانایی انجام این کار را ندارند. همه آنها در زمان پاسخ گویی به جستوجوهای کاربران، تنها در پایگاه دادهای که در اختیار دارند به جستوجو میپردازند و نه در وب! موتور جستوجوگر به کمک بخشهای متفاوت خود، اطلاعات مورد نیاز را قبلا جمعآوری، تجزیه و تحلیل میکند، آن را در پایگاه دادهاش ذخیره مینماید و به هنگام جستوجوی کاربر تنها در همین پایگاه داده میگردد.
بخشهای مجزای یک موتور جستوجوگر عبارتند از:
ـ Spider
ـ Crawler
ـ Indexer
ـ Database
ـ Ranker
حال هر کدام را به تفضیل بررسی میکنیم:
▪ Spider (عنکبوت): اسپایدر نرمافزاری است که کار جمعآوری اطلاعات مورد نیاز یک موتور جستوجوگر را بر عهده دارد. اسپایدر به صفحات مختلف سر میزند، محتوای آنها را میخواند، لینکها را دنبال، اطلاعات مورد نیاز را جمعآوری و آن را در اختیار سایر بخشهای موتور جستوجوگر قرار میدهد. همانطور که کاربران، صفحات مختلف را بازدید میکنند، اسپایدر هم درست این کار را انجام میدهد با این تفاوت که اسپایدر کدهای HTML صفحات را میبیند اما کاربران نتیجه حاصل از کنار هم قرار گرفتن این کدها را. اسپایدر، به هنگام مشاهده صفحات، بر روی سرورها رد پا برجای میگذارد.
شما اگر اجازه دسترسی به آمار دید و بازدیدهای صورت گرفته از یک سایت و اتفاقات انجام شده در آن را داشته باشید، میتوانید مشخص کنید که اسپایدر کدام یک از موتورهای جستوجوگر صفحات سایت را مورد بازدید قرار داده است.
▪ Crawler (خزنده): کراولر، نرمافزاری است که به عنوان یک فرمانده برای اسپایدر عمل میکند. خزنده مشخص میکند که اسپایدر کدام صفحات را مورد بازدید قرار دهد. در واقع کراولر تصمیم میگیرد که کدام یک از لینکهای صفحهای که اسپایدر در حال حاضر در آن قرار دارد، دنبال شود. کراولر، ممکن است قبلا برنامهریزی شده باشد که آدرسهای خاصی را طبق برنامه، در اختیار اسپایدر قرار دهد تا از آنها دیدن کند. دنبال کردن لینکهای یک صفحه به این بستگی دارد که موتور جستوجوگر چه حجمی از اطلاعات یک سایت را میتواند در پایگاه دادهاش ذخیره کند. همچنین ممکن است اجازه دسترسی به بعضی از صفحات به موتورهای جستوجوگر داده نشده باشد. دارنده سایت، همان طور که دوست دارد موتورهای جستوجوگر اطلاعات سایت را با خود ببرند، میتواند آنها را از بعضی صفحات سایت دور کند و اجازه دسترسی به محتوای آن صفحات را به آنها ندهد.
▪ Indexer (بایگانی کننده): تمام اطلاعات جمعآوری شده توسط اسپایدر در اختیار ایندکسر قرار میگیرد. در این بخش اطلاعات ارسالی مورد تجزیه و تحلیل قرار میگیرند و به بخشهای متفاوتی تقسیم میشوند. تجزیه و تحلیل بدین معنی است که مشخص میشود اطلاعات از کدام صفحه ارسال شده است، چه حجمی دارد، کلمات موجود در آن کدامند، کلمات چند بار تکرار شدهاند، کلمات در کجای صفحه قرار دارند و ... . در حقیقت ایندکسر، صفحه را به پارامترهای آن خرد میکند و تمام این پارامترها را به یک مقیاس عددی تبدیل میکند تا سیستم رتبهبندی بتواند پارامترهای صفحات مختلف را با هم مقایسه کند. در زمان تجزیه و تحلیل اطلاعات، ایندکسر برای کاهش حجم دادهها از بعضی کلمات که بسیار رایج هستند صرفنظر میکند. کلماتی نظیر a، an، the، www، is و ... از این گونه کلمات هستند.
▪ DataBase (پایگاه داده): تمام دادههای تجزیه و تحلیل شده در ایندکسر، به پایگاه داده ارسال میگردد. در این بخش دادهها گروهبندی، کدگذاری و ذخیره میشود. همچنین دادهها قبل از آنکه ذخیره شوند، طبق تکنیکهای خاصی فشرده میشوند تا حجم کمی از پایگاه داده را اشغال کنند. یک موتور جستوجوگر باید پایگاده داده عظیمی داشته باشد و به طور مداوم حجم محتوای آنرا گسترش دهد و البته اطلاعات قدیمی را هم به روز رسانی نماید. بزرگی و به روز بودن پایگاه داده یک موتور جستوجوگر برای آن امتیاز محسوب میگردد. یکی از تفاوتهای اصلی موتورهای جستوجوگر در حجم پایگاه داده آنها و همچنین روش ذخیرهسازی دادهها در پایگاه داده است.
▪ Ranker (سیستم رتبهبندی): کاربران برای استفاده از یک موتور جستوجو چند کلمه را در جعبه جستوجوی آن وارد میکنند و سپس با فشردن Enter منتظر پــاسخ میمانند. برای پاسخگویی به درخواست کاربر، ابتدا تمام صفحات موجود در پایگاه داده که به موضوع جستوجو شده، مرتبط هستند، مشخص میشوند. پس از آن سیستم رتبهبندی وارد عمل شده، آنها را از بیشترین ارتباط تا کمترین ارتباط مرتب میکند و به عنوان نتایج جستوجو به کاربر نمایش میدهد.
حتی اگر موتور جستوجوگر بهترین و کاملترین پایگاه داده را داشته باشد اما نتواند پاسخهای مرتبطی را ارائه کند، یک موتور جستوجوگر ضعیف خواهد بود. در حقیقت سیستم رتبهبندی قلب تپنده یک موتور جستوجوگر است و تفاوت اصلی موتورهای جستوجوگر در این بخش قرار دارد. سیستم رتبهبندی برای پاسخگویی به سوالات کاربران، پارامترهای بسیاری را در نظر میگیرد تا بتواند بهترین پاسخها را در اختیار آنها قرار دارد.
● راه ورود موتور جستوجوگر به یک سایت
موتور جستوجوگر میتواند از راههای متفاوتی به یک سایت وارد شود. این راهها همان لینکها هستند. موتور جستوجوگر برای خواندن صفحات سایت مجوزهای لازم و محدودیتها را در فایل ROBOTS.TXT بررسی میکند، هر چند که میتواند آن مجوزها را به طور کلی نادیده بگیرد. موتور جستوجوگر میتواند انواع فایل را بخواند: فایل DOC، PDF، HTML، PHP و ... شب به سایت سر بزند و یا روز. گاهی هم که به سایت سر میزند با دست خالی بر میگردد زیرا سرور سایت جواب نمیدهد و سایت موقتا و یا برای همیشه فعال نیست.
اگر میخواهید موتور جستوجوگر را به میهمانی سایتتان دعوت کنید باید راه را هم به وی نشان دهید و وی آدرس سایت شما را بداند. موتور جستوجوگر بهانههای بسیاری برای نپذیرفتن این دعوت دارد زیرا در همان لحظه به سایتهای بسیار دیگری هم دعوت شده است! بنابراین باید در آدرس دادن نهایت دقت را انجام دهید. پیوندی هم که شما با آن موتور جستوجوگر را به سایتتان دعوت میکنید، بسیار مهم است. همواره پیوند به سایتتان را در سایت (صفحات) مهم دیگر قرار دهید تا موتور جستوجوگر نه یکبار که چندین بار به سایت شما از آن طریق مراجعه کند.
موتور جستوجوگر، کافیست که آدرس سایت شما را یاد بگیرد. آن وقت میتوانید مطمئن باشید که هر ماه حداقل یکبار بدان مراجعه میکند. اما اگر پیوندهای سایتتان در سایتهای معتبر و مهمی باشند آن وقت بیش از یک بار در ماه و حتی هر چند روز یک بار بدان مراجعه میکند. پیوند دادن و پیوند گرفتن امروزه مقولهای بسیار جدی میان مدیران سایتهاست. شاید هر روزه میلیونها پست الکترونیک فقط برای این موضوع میان مدیران سایتها رد و بدل میشود
منبع : دنیای کامپیوتر و اینترنت
ایران مسعود پزشکیان دولت چهاردهم پزشکیان مجلس شورای اسلامی محمدرضا عارف دولت مجلس کابینه دولت چهاردهم اسماعیل هنیه کابینه پزشکیان محمدجواد ظریف
پیاده روی اربعین تهران عراق پلیس تصادف هواشناسی شهرداری تهران سرقت بازنشستگان قتل آموزش و پرورش دستگیری
ایران خودرو خودرو وام قیمت طلا قیمت دلار قیمت خودرو بانک مرکزی برق بازار خودرو بورس بازار سرمایه قیمت سکه
میراث فرهنگی میدان آزادی سینما رهبر انقلاب بیتا فرهی وزارت فرهنگ و ارشاد اسلامی سینمای ایران تلویزیون کتاب تئاتر موسیقی
وزارت علوم تحقیقات و فناوری آزمون
رژیم صهیونیستی غزه روسیه حماس آمریکا فلسطین جنگ غزه اوکراین حزب الله لبنان دونالد ترامپ طوفان الاقصی ترکیه
پرسپولیس فوتبال ذوب آهن لیگ برتر استقلال لیگ برتر ایران المپیک المپیک 2024 پاریس رئال مادرید لیگ برتر فوتبال ایران مهدی تاج باشگاه پرسپولیس
هوش مصنوعی فناوری سامسونگ ایلان ماسک گوگل تلگرام گوشی ستار هاشمی مریخ روزنامه
فشار خون آلزایمر رژیم غذایی مغز دیابت چاقی افسردگی سلامت پوست