جمعه, ۳۱ فروردین, ۱۴۰۳ / 19 April, 2024
مجله ویستا

جست‌وجو، کلید حل معماها در اینترنت


جست‌وجو، کلید حل معماها در اینترنت
اگر در گذشته یافتن مطالب مورد نیازمان احتیاج به مسافرت و یا صرف وقت زیادی داشت و سخت بود،
امروزه با نشستن در پشت کامپیوتر و اتصال به شبکه جهانی اینترنت آن اطلاعات و دانش در اختیار ما قرار می‌گیرد. چگونه؟ جست‌وجو کلید حل این معماست.
● جست‌و‌جو، کلید حل معما در اینترنت
اینترنت شبکه‌ای بسیار گسترده است و حاوی مطالب زیادی در موضوعات گوناگون. این رسانه جدید که انقلابی در زمینه اطلاعات ایجاد کرده قرن نوین را به قرن اطلاعات بدل نموده است. اگر در گذشته یافتن مطالب مورد نیازمان احتیاج به مسافرت و یا صرف وقت زیادی داشت و سخت بود، امروزه با نشستن در پشت کامپیوتر و اتصال به شبکه جهانی اینترنت آن اطلاعات و دانش در اختیار ما قرار می‌گیرد. اما چگونه می‌توانیم در بین این حجم اطلاعات در این رسانه مطلب مورد نظر خود را بیابیم. جست‌وجو کلید حل این معماست.
● ابزار‌های جست‌وجو
همان طورکه فهرست مطالب و نمایه‌ها ابزارهای اصلی برای دسترسی به محتوای کتاب‌ها و مجلات به شمار می‌روند، ابزارهای کاوش نیز جست‌وجو و بازیابی منابع اطلاعاتی موجود در شبکه اینترنت را تسهیل می‌نمایند. هر کدام از ابزارهای کاوش، محتوا، پوشش و واسط منحصر به فرد خود را دارند و برای استفاده از آنها و همچنین انجام جست‌وجوی موفق و مفید در آنها باید از مجموعه‌ای از اصول و قواعد جست‌وجو در این ابزارها آگاه بود.
آشنایی با این ابزارها برای جست‌وجوگران اطلاعات در اینترنت امری ضروری می‌باشد و لازم است. ضمن شناسایی ابزارهای کاوش اینترنت در حوزه‌های مختلف، با روش‌های جست‌وجو در آنها آشنا شده و مناسب‌ترین آنها را برای رفع نیازهای اطلاعاتی خود انتخاب نمایند. ابزارهای کاوش اینترنت در یک دسته‌بندی کلی در دو دسته موتورهای جست‌وجو و راهنماهای موضوعی تقسیم‌بندی می‌شوند.
▪ راهنماهای موضوعی وب (Web Directory): راهنماهای وب یکی از مهم‌ترین ابزارهای کاوش در اینترنت به شمار می‌روند که گزینشی بوده و منابع آنها بر اساس موضوع دسته‌بندی شده‌اند. در این ابزارها جست‌وجو را می‌توان در ساختار موضوعی و به صورت سلسله مراتبی انجام داد.
راهنماهای وب بر خلاف موتورهای جست‌وجوی کلید واژه‌ای، امکان دسترسی سریع و مناسب به اطلاعات معتبر و ارزشمند تحلیل شده را منطبق با نیازهای مخاطبان از طریق ساختار موضوعی نظام‌مند در اختیار قرار می‌دهند. در واقع نتایج جست‌وجو از طریق راهنماهای موضوعی در هم ریختگی کمتری دارد، زیرا منابع و وب سایت‌هایی که پیدا می‌شوند در اغلب موارد به وسیلة متخصصان موضوعی گزینش شده‌اند، لذا کاربر کل شبکه وب را جست‌وجو نمی‌کند، بلکه روی طبقه موضوعی انتخاب شده به جست‌وجو می‌پردازد و از این طریق از اتلاف وقت کاربر جلوگیری می‌شود.
به عبارت دیگر، راهنماهای وب مجموعه‌ای از منابع شبکه وب را در ساختار موضوعی کلی (فرضاً سلسله مراتبی یا درختی) دسته‌بندی کرده و آنها را در طبقه موضوعی کلی و هر طبقه را به موضوعات ریز و خاص‌تر تقسیم می‌کنند. نقطه قوت این ابزارها دقیق و مرتبط بودن نتیجه جست‌وجو با موضوع مورد نظر و اعتبار و کیفیت بالای منابع بازریابی شده و نقطه ضعف آنها نیز پوشش محدود منابع وب، چند مرحله‌ای بودن فرآیند جست‌وجو و همچنین پایین بودن سرعت روزآمدی منابع آنها می‌باشد.
▪ موتورهای جست‌وجو (Search Engines): موتورهای جست وجو ابزارهایی هستند که برای کاوش انواع منابع اطلاعاتی موجود در شبکه اینترنت طراحی شده‌اند. موتورهای جست‌وجو با جمع‌آوری صفحات وب و ایجاد پایگاه‌های اطلاعاتی فرآیند مرور و جست‌وجو را برای استفاده‌کنندگان تسهیل می‌کنند. به کمک این ابزارها و از طریق کلید واژه، عبارت و سایر قابلیت‌ها می‌توان به جست‌وجوی اطلاعات در اینترنت پرداخت.
هر کدام از موتورهای جست‌وجو از برخی جنبه‌ها با هم تفاوت دارند و نقاط قوت و ضعف و نیز گسترة اطلاعات خاص خود را دارا می‌باشند که باید بر اساس نیاز اطلاعاتی و نوع مدرک مورد جست‌وجو هر یک از این ابزارها را برای جست‌وجوی منابع وب انتخاب کرد. در واقع موتورهای جست‌وجو از نظر تنوع، محتوا و استراتژی‌های جست‌وجو، تهیه منابع و مجموعة ابزارهایی که برای کمک به استفاده‌کنندگان ارائه می‌دهند، تفاوت‌ها و پیچیدگی‌های خاص خود را دارا هستند. از طرفی بوسیله هیچ یک از موتورهای جست‌وجو نمی‌توان در تمام منابع اطلاعاتی موجود در اینترنت جست‌وجوکرد.
با تایپ واژه یا عبارت مربوط به موضوع مورد نظر خود در هر کدام از این ابزارها، همه صفحات و سایت‌های مرتبط با آن موضوع بازیابی می‌شوند. از نقاط قوت این ابزارها می‌توان به پوشش وسیع منابع وب و سرعت در روزآمد‌سازی منابع و از نقاط ضعف آن نیز می‌توان به بازیابی بعضی منابع کم ربط یا نامربوط با موضوع مورد نظر اشاره کرد.
تفاوت اصلی این دو گروه نیز در نحوه تشکیل پایگاه داده و جمع‌آوری اطلاعات آنهاست. در فهرست‌ها، این کار به عهده انسان است اما در موتورهای جست‌وجوگر جمع‌آوری اطلاعات پایگاه داده را نرم‌افزارها انجام می‌دهند. دانستن تفاوت کار این دو گروه بسیار مهم است زیرا هر یک از آنها به گونه‌ای متفاوت رفتار می‌نمایند. فهرست هرگز از وجود یک سایت اطلاع نمی‌یابد مگر زمانی‌که شخصی آن را به وی معرفی نماید.
بعد از معرفی است که ویراستار آن فهرست به سایت شما مراجعه نموده، در صورت رعایت قوانین فهرست و انتخاب گروه مناسب، آن سایت را به پایگاه داده فهرست اضافه می‌نماید. اما در موتورهای جست‌وجوگر وضع به گونه‌ای دیگر است، موتور جست‌وجوگر می‌تواند از وجود آن سایت اطلاع یابد اگر راه ورود آن فراهم شده باشد. در واقع نرم‌افزار موتور جست‌وجوگر هر لحظه در حال وبگردی و به روزرسانی اطلاع قدیمی و همین طور افزودن اطلاعات جدید به پایگاه داده موتور جست‌وجوگر است.
● بخش‌های مختلف یک موتور جست‌وجو
جست‌وجویی در یک موتور جست‌وجوگر انجام و نتایج جست‌وجو ارائه می‌شود، کاربران در واقع نتیجه کار بخش‌های متفاوت موتور جست‌وجوگر را می‌بینند. موتور جست‌وجوگر قبلا پایگاه داده‌اش را آماده کرده است و این گونه نیست که درست در همان لحظه جست‌وجو، تمام وب را بگردد. هیچ موتور جست‌وجوگری توانایی انجام این کار را ندارند. همه آنها در زمان پاسخ گویی به جست‌وجوهای کاربران، تنها در پایگاه داده‌ای که در اختیار دارند به جست‌وجو می‌پردازند و نه در وب! موتور جست‌وجوگر به کمک بخش‌های متفاوت خود، اطلاعات مورد نیاز را قبلا جمع‌آوری، تجزیه و تحلیل می‌کند، آن را در پایگاه داده‌اش ذخیره می‌نماید و به هنگام جست‌وجوی کاربر تنها در همین پایگاه داده می‌گردد.
بخش‌های مجزای یک موتور جست‌وجوگر عبارتند از:
ـ Spider
ـ Crawler
ـ Indexer
ـ Database
ـ Ranker
حال هر کدام را به تفضیل بررسی می‌کنیم:
▪ Spider (عنکبوت): اسپایدر نرم‌افزاری است که کار جمع‌آوری اطلاعات مورد نیاز یک موتور جست‌وجوگر را بر عهده دارد. اسپایدر به صفحات مختلف سر می‌زند، محتوای آنها را می‌خواند، لینک‌ها را دنبال، اطلاعات مورد نیاز را جمع‌آوری و آن را در اختیار سایر بخش‌های موتور جست‌وجوگر قرار می‌دهد. همانطور که کاربران، صفحات مختلف را بازدید می‌کنند، اسپایدر هم درست این کار را انجام می‌دهد با این تفاوت که اسپایدر کدهای HTML صفحات را می‌بیند اما کاربران نتیجه حاصل از کنار هم قرار گرفتن این کدها را. اسپایدر، به هنگام مشاهده صفحات، بر روی سرورها رد پا برجای می‌گذارد.
شما اگر اجازه دسترسی به آمار دید و بازدیدهای صورت گرفته از یک سایت و اتفاقات انجام شده در آن را داشته باشید، می‌توانید مشخص کنید که اسپایدر کدام یک از موتورهای جست‌وجوگر صفحات سایت را مورد بازدید قرار داده است.
▪ Crawler (خزنده): کراولر، نرم‌افزاری است که به عنوان یک فرمانده برای اسپایدر عمل می‌کند. خزنده مشخص می‌کند که اسپایدر کدام صفحات را مورد بازدید قرار دهد. در واقع کراولر تصمیم می‌گیرد که کدام یک از لینک‌های صفحه‌ای که اسپایدر در حال حاضر در آن قرار دارد، دنبال شود. کراولر، ممکن است قبلا برنامه‌ریزی شده باشد که آدرس‌های خاصی را طبق برنامه، در اختیار اسپایدر قرار دهد تا از آنها دیدن کند. دنبال کردن لینک‌های یک صفحه به این بستگی دارد که موتور جست‌وجوگر چه حجمی از اطلاعات یک سایت را می‌تواند در پایگاه داده‌اش ذخیره کند. همچنین ممکن است اجازه دسترسی به بعضی از صفحات به موتورهای جست‌وجوگر داده نشده باشد. دارنده سایت، همان طور که دوست دارد موتورهای جست‌وجوگر اطلاعات سایت را با خود ببرند، می‌تواند آنها را از بعضی صفحات سایت‌ دور کند و اجازه دسترسی به محتوای آن صفحات را به آنها ندهد.
▪ Indexer (بایگانی کننده): تمام اطلاعات جمع‌آوری شده توسط اسپایدر در اختیار ایندکسر قرار می‌گیرد. در این بخش اطلاعات ارسالی مورد تجزیه و تحلیل قرار می‌گیرند و به بخش‌های متفاوتی تقسیم می‌شوند. تجزیه و تحلیل بدین معنی است که مشخص می‌شود اطلاعات از کدام صفحه ارسال شده است، چه حجمی دارد، کلمات موجود در آن کدامند، کلمات چند بار تکرار شده‌اند، کلمات در کجای صفحه قرار دارند و ... . در حقیقت ایندکسر، صفحه را به پارامترهای آن خرد می‌کند و تمام این پارامترها را به یک مقیاس عددی تبدیل می‌کند تا سیستم رتبه‌بندی بتواند پارامترهای صفحات مختلف را با هم مقایسه کند. در زمان تجزیه و تحلیل اطلاعات، ایندکسر برای کاهش حجم داده‌ها از بعضی کلمات که بسیار رایج هستند صرف‌نظر می‌کند. کلماتی نظیر a، an، the، www، is و ... از این گونه کلمات هستند.
▪ DataBase (پایگاه داده): تمام داده‌های تجزیه و تحلیل شده در ایندکسر، به پایگاه داده ارسال می‌گردد. در این بخش داده‌ها گروه‌بندی، کدگذاری و ذخیره می‌شود. همچنین داده‌ها قبل از آنکه ذخیره شوند، طبق تکنیک‌های خاصی فشرده می‌شوند تا حجم کمی از پایگاه داده را اشغال کنند. یک موتور جست‌وجوگر باید پایگاده داده عظیمی داشته باشد و به طور مداوم حجم محتوای آنرا گسترش دهد و البته اطلاعات قدیمی را هم به روز رسانی نماید. بزرگی و به روز بودن پایگاه داده یک موتور جست‌وجوگر برای آن امتیاز محسوب می‌گردد. یکی از تفاوت‌های اصلی موتورهای جست‌وجوگر در حجم پایگاه داده آنها و همچنین روش ذخیره‌سازی داده‌ها در پایگاه داده است.
▪ Ranker (سیستم رتبه‌بندی): کاربران برای استفاده از یک موتور جست‌وجو چند کلمه را در جعبه جست‌وجوی آن وارد می‌کنند و سپس با فشردن Enter منتظر پــاسخ می‌مانند. برای پاسخگویی به درخواست کاربر، ابتدا تمام صفحات موجود در پایگاه داده که به موضوع جست‌وجو شده، مرتبط هستند، مشخص می‌شوند. پس از آن سیستم رتبه‌بندی وارد عمل شده، آنها را از بیشترین ارتباط تا کمترین ارتباط مرتب می‌کند و به عنوان نتایج جست‌وجو به کاربر نمایش می‌دهد.
حتی اگر موتور جست‌وجوگر بهترین و کامل‌ترین پایگاه داده را داشته باشد اما نتواند پاسخ‌های مرتبطی را ارائه کند، یک موتور جست‌وجوگر ضعیف خواهد بود. در حقیقت سیستم رتبه‌بندی قلب تپنده یک موتور جست‌وجوگر است و تفاوت اصلی موتورهای جست‌وجوگر در این بخش قرار دارد. سیستم رتبه‌بندی برای پاسخ‌گویی به سوالات کاربران، پارامترهای بسیاری را در نظر می‌گیرد تا بتواند بهترین پاسخ‌ها را در اختیار آنها قرار دارد.
● راه ورود موتور جست‌وجوگر به یک سایت
موتور جست‌وجوگر می‌تواند از راه‌های متفاوتی به یک سایت وارد شود. این راه‌ها همان لینک‌ها هستند. موتور جست‌وجوگر برای خواندن صفحات سایت مجوزهای لازم و محدودیت‌ها را در فایل ROBOTS.TXT بررسی می‌کند، هر چند که می‌تواند آن مجوزها را به طور کلی نادیده بگیرد. موتور جست‌وجوگر می‌تواند انواع فایل را بخواند: فایل DOC، PDF، HTML، PHP و ... شب به سایت سر بزند و یا روز. گاهی هم که به سایت سر می‌زند با دست خالی بر می‌گردد زیرا سرور سایت جواب نمی‌دهد و سایت موقتا و یا برای همیشه فعال نیست.
اگر می‌خواهید موتور جست‌وجوگر را به میهمانی سایتتان دعوت کنید باید راه را هم به وی نشان دهید و وی آدرس سایت شما را بداند. موتور جست‌وجوگر بهانه‌های بسیاری برای نپذیرفتن این دعوت دارد زیرا در همان لحظه به سایت‌های بسیار دیگری هم دعوت شده است! بنابراین باید در آدرس دادن نهایت دقت را انجام دهید. پیوندی هم که شما با آن موتور جست‌وجوگر را به سایتتان دعوت می‌کنید، بسیار مهم است. همواره پیوند به سایتتان را در سایت (صفحات) مهم دیگر قرار دهید تا موتور جست‌وجوگر نه یکبار که چندین بار به سایت شما از آن طریق مراجعه کند.
موتور جست‌وجوگر، کافیست که آدرس سایت شما را یاد بگیرد. آن وقت می‌توانید مطمئن باشید که هر ماه حداقل یکبار بدان مراجعه می‌کند. اما اگر پیوندهای سایتتان در سایت‌های معتبر و مهمی باشند آن وقت بیش از یک بار در ماه و حتی هر چند روز یک بار بدان مراجعه می‌کند. پیوند دادن و پیوند گرفتن امروزه مقوله‌ای بسیار جدی میان مدیران سایت‌هاست. شاید هر روزه میلیون‌ها پست الکترونیک فقط برای این موضوع میان مدیران سایت‌ها رد و بدل می‌شود
منبع : دنیای کامپیوتر و اینترنت


همچنین مشاهده کنید