دوشنبه ۲۸ خرداد ۱۳۹۷ / Monday, 18 June, 2018

تکنیک های جست وجو در اینترنت


تکنیک های جست وجو در اینترنت
اینترنت را به زباله دانی بزرگ تشبیه کردهاند که در آن قطعات الماس یافت می شود منتهی اگر کسی روش زباله گردی در فضای اینترنت را نداند، احتمالا روزها و ماه ها در میان انبوه اطلاعات به درد نخور سرگردان خواهد شد و سرانجام بدون هیچ نتیجه مثبتی آن جا را ترک خواهد کرد.معمولا سخنی که از این دسته افراد شنیده می شود این است: اطلاعات مناسبی وجود نداشت. اما وبگردهای حرفه ای و کسانی که با روش ها و فوت و فن های جست وجو در اینترنت آشنایی دارند، هیچ وقت دست خالی از این فضای مجازی برنمی گردند آن ها همواره قطعات الماس را در میان انبوه زباله های اطلاعاتی تشخیص می دهند.
مهم ترین روش های جست وجو در اینترنت را تشریح کرده ایم:ابزارهای کاوش و جست وجو در وب را می توان به چند گروه تقسیم کرد که عبارت است از:
۱) فهرست راهنما یا دایرکتوری Directory
۲) شاهراه اطلاعاتی Gateway
۳) موتور جست وجو engine Search
۴) فراموتور جست وجو
۵) درگاه یا مدخل Metasearch
۶) وب نامرئی Wed Invisidle
● فهرست راهنما یا دایرکتوری
فهرست راهنما یا دایرکتوری که به آن فهرست موضوعی نیز گفته می شود، سایتی است که صفحات و سایت های مربوط به موضوعات گوناگون علمی و غیرعلمی را شناسایی و به صورت دستی دستهبندی می کند، از این رو اطلاعات طبقه بندی شده در فهرست راهنما از کیفیت خوبی برخوردار است و نتایج نامربوط در بین آن ها بسیار اندک می باشد. به جرات می توان گفت بزرگ ترین و معتبرترین فهرست راهنمای اینترنت در حال حاضر project birectory open می باشد که نشانی آنorg .zbmo.www است. جالب است بدانید بسیاری از موتورهای جست وجو مانند گوگل و Altavista در دایرکتوری خود از همین فهرست راهنما استفاده می کنند. از جمله فهرست های راهنمای دیگر می توان به com.adout و com.Yahoo اشاره کرد.
● شاهراه اطلاعاتی
شاهراه اطلاعاتی در واقع نوع تخصصی دایرکتوری است. یعنی اطلاعات طبقه بندی شده در شاهراه محدود به یک موضوع می باشد. مانند شاهراه اطلاعاتی جامعه شناسی. اما دایرکتوری یا فهرست راهنما در همه زمینه ها به جمع آوری و طبقه بندی اطلاعات می پردازد. معمولا شاهراه اطلاعاتی را استادان فن ارائه می کنند. از این نظر هرچند که ممکن است نشانی های موجود در آن اندک باشد، اما از اعتبار علمی بسیار بالایی برخوردار است. سایت com.acabemicinfo فهرستی از شاهراه های اطلاعاتی مربوط به رشته های مختلف علمی را دسته بندی کرده است.
● موتور جست وجو
"موتور جست وجو برنامه ای نرم افزاری است که با استفاده از کلیدواژه به جست وجوی منابع اطلاعاتی اینترنت می پردازد و فهرستی از مدارک واجد آن کلیدواژه را ارائه می دهد." موتورهای جست وجو نرم افزارهایی است که توسط رایانه ساخته شده و اطلاعات آن طبقه بندی موضوعی نشده است تمامی صفحات پشتیبانی شده براساس الگوریتم مشخص مرتب می شود و دارای اطلاعات وسیع عظیم و ارزیابی نشده می باشد.
محتویات یک موتور جست وجو در واقع همان بانک اطلاعات آن است. اما موتورهای جست وجو از شیوه های مختلفی برای جمع آوری و تشکیل بانک اطلاعاتی خویش بهره می برند و به همین دلیل نتایج جست وجوی یک واژه یا عبارت در موتورهای مختلف یکسان نیست.هر موتور جست وجو برای تعیین میزان تناسب و ارتباط واژگان جست وجو با صفحات واجد آن ها، از یک یا چند ملاک معتبر استفاده می کند. اما از بین معیارهای متعدد و رایج در میان موتورهای جست وجو ۲ معیار از اهمیت بیشتری برخوردار است.
▪ محل درج کلیدواژه:
چنان چه پیشتر نیز گفتم، یک صفحه وب از اجزا و عناصر مختلفی تشکیل شده است که اهمیت همه آن ها یکسان نیست. به طور کلی واژگان موجود در عنوان و خطوط اول صفحه یا سرتیتر در مقایسه با متن از اهمیت بیشتری برخوردار است.
▪ تعداد تکرار:
در اغلب موتورهای جست وجو در صفحاتی که واژگان جست وجو تکرار بیشتری داشته باشد، صفحات متناسبتر و مرتبط تر به حساب می آید.
▪ نوار ابزار جست وجو:
به جای مراجعه مستقیم به سایت اصلی جست وجوگر، می توانید نوار ابزار آن را در زیر نوار اصلی IE بگذارید. گوگل چنین ابزاری را به صورت یک on-abb دراختیار شما قرار می دهد.(به نشانی com.google.tooldar سربزنید) این ابزار امکانات دیگری مانند متوقف کننده popupها را نیز دارد.
▪ حذف از جست وجوها:
همه موتورهای جست وجو به شما این امکان را می دهد که نتایج جست وجو را به نحو مناسب محدود کنید. به عنوان مثال، وقتی در گوگل لغت خاصی را جست وجو می کنید، هزاران نتیجه به شما نشان داده می شود.راه حل محدود کردن نتایج جست وجو این است که از علامت ویژه در کنار عباراتی که مورد نظر شما نیست، استفاده کنید. به عنوان مثال بنویسید bogs-cats یعنی نتایج مرتبط با کلمه cats ▪ بدون bogsدر نظر گرفتن کلمات:
برخی جست وجوگرها برای محدود کردن نتایج جست وجو، کلمات اضافه و لغات کوچک را هنگام جست وجو مورد توجه قرار نمی دهند. به طور مثال از to، the،is،from صرف نظر می کنند. چنانچه فکر می کنید این کلمات در جست وجوی شما موثر است و منجر به کسب نتیجه بهتری از جست وجو می شود، می توانید آن ها را با گذاشتن یک علامت«» مشخص کنید.
▪ استفاده از گیومه:
وقتی که شما در جست وجویتان به دنبال یافتن یک عبارت مشخص هستید، ساده تر آن است که عبارت را داخل گیومه قرار دهید. به طور مثال عبارت مورد نظرتان را به صورت «.............»وارد کنید. نتیجه جست وجو فقط شامل عبارت داخل گیومه خواهد شد.
▪ به دنبال یک آدرس خاص:
چنان چه فقط بخشی از آدرس اینترنتی صفحه مورد نظرتان را می دانید، برای انجام جست وجوی سریع تر، می توانید کلمه ای را که مطمئن هستید در آدرس سایت وجود دارد، وارد کنید، به طور مثال عبارت worb:url را در جستوجوگر وارد کنید. نتایج جست وجو تنها شامل آدرس های اینترنتی خواهد شد که این کلمه خاص را در خود دارد.
▪ پیدا کردن سایت خودتان:
اگر یک سایت دارید، آیامی دانید که چه طور باید سایت هایی را که به سایت شما لینک داده اند، پیدا کنید در موتور جست وجو عبارتcom.yourwedabbress.www را وارد کنید و آدرس تمام سایت هایی که لینکی به سایت شما داده اند، ملاحظه کنید.
▪ پیدا کردن فایل:
در بسیاری از مواقع شما به فایلی احتیاج دارید که مشکلی از سیستم تان را برطرف می کند. برای یافتن آن نیازی نیست که هزاران صفحه وب را زیرورو کنید. با تایپ عبارت filename the:file در کادر جست وجو، یک فهرست از همه وب سایت هایی که نسخه ای از فایل مذکور را دارد، نمایش داده می شود. کاربرد این روش برای پیدا کردن فایل های تصویری نیز بسیار مفید است.
▪ ترفند پنهانی گوگل:
نوعی جست وجوی خاص نیز در گوگل وجود دارد، اگرچه همه از جزئیات آن خبر ندارند. گوگل به شما کمک می کند که در یک صفحه وب به دنبال کلمه بگردید که هم در URL و هم در آن صفحه وجود دارد. برای این منظور تایپ کنید Keyworb:url
▪ پیدا کردن تصاویر:
وقتی شما از موتور جست وجویی استفاده می کنید که برای جست وجوی تصاویر، پیش نمایشی از آن ها را نشان نمی دهد، ممکن است آدرس سایت هایی را برایتان بیابد که شامل عکس مورد نظرتان نباشد. برای نتیجه گیری سریع تر می توانید به نشانی com.google.image مراجعه کنید. در این جا کافی است نام شخص یا موضوع مورد نظر را وارد کنید. گوگل تصاویر بندانگشتی(thumdnail) در این رابطه را نمایش خواهد داد.
▪ پاسخی به سوالات:
به سایت com.ask.www سربزنید و پاسخ همه سوالات خود را در آن پیدا کنید. همچنین می توانید در این سایت به بیشترین مواردی که دیگران جست وجو کرده اند نیز نگاهی بیندازید.
▪ راهنمای گوگل:
در صفحه اصلی گوگل، گزینه جست وجوی پیشرفته(search Abvanceb) را کلیک کنید. در این جا می توانید نتایج جست وجویتان را محدود کنید. در بعضی مواقع دیدن صفحات وبی که مربوط به ۲یا۳سال قبل است، دیگر فایده ای ندارد. در این جا می توانید برای پیدا کردن صفحات جدیدتر گزینه ۳ماه، ۶ماه یا یک سال را انتخاب کنید.
▪ فراموتورهای جست وجو:
جست وجوی ترکیبی یا فراموتورها یا Metasearch برای حل مشکل جست وجوگرهای معمولی به کار گرفته می شود.برای مثال وب سایت داگ پایل(Dogpile) یا موتور آل دوب(allthewed) که در واقع نوعی جست وجوگر ترکیبی است، به شما امکان می دهد به آسانی در تمام جست وجوگرهای شناخته شده اینترنت، متن، عکس، صدا، فیلم، خبر یا کالای مورد نظر خود را بیابید. یافته های داگ پایل را می توان براساس نام جستوجوگری که آن اطلاعات را پیدا کرده است و یا براساس نزدیکی یافته ها به عبارت مورد نظر شما تفکیک کرد. همین طور در سمت چپ صفحه فهرستی از کلید واژه های مرتبط با چیزی که شما دنبال آن می گردید، ارائه می شود که خیلی وقت ها به کمک می آید. برای کسانی که در پی اطلاعات مربوط به شخص یا شرکت یا فروشگاهی به خصوص می گردند، جست وجو در کتاب های زرد و سفید هم امکان پذیر است.داگ پایل ابزار جست وجوی کوچکی هم دارد که اگر مایل باشید، می توانید به بالای صفحه مرورگر وبتان اضافه کنید تا جست وجو در آن آسان تر شود.
● موتورهای جست وجوی فارسی
انتخاب موتور جست وجو عامل مهمی در فرآیند جست وجو است. در حال حاضر ابزارهای کاوش مختلفی در ایران ظهور پیدا کرده است. لیکن ابزارهای جست وجویی که امکان جست وجوی اطلاعات به زبان فارسی را ارائه می کند، محدود است. از طرف دیگر،امکانات و قابلیت آن ها برای بازیابی موثر و مناسب اطلاعات متغیر است. برخی از ابزارهای کاوش با امکانات جست وجوی فارسی عبارت است از: ایران هو Iranhoo، پارسیکParseek، گوگل گوگلدر بین این ابزارهای کاوش، تنها موتور کاوش گوگل دارای برنامه روبات به منظور شناسایی و نمایه سازی صفحات یا سایت های وب به زبان فارسی و نمایه سازی خودکار می باشد و قادر است صفحات فارسی را در قالب یونی کد شناسایی و در پایگاه خود نمایه کند. سایت پارسیک نیز از پایگاه گوگل برای جست وجو و بازیابی اطلاعات استفاده می کند.
● وب نامرئی
اصطلاح "وب نامرئی" برای اطلاعاتی به کار می رود که روی شبکه جهانی وب است، اما با استفاده از موتورهای جست وجوی همه منظوره یافت نمی شود. وب نامرئی به ۲دلیل کمی و کیفی اهمیت دارد. کمی از این نظر که موتورهای جست وجو فقط قادر است حدود ۱۶درصد از اطلاعات موجود در اینترنت را بازیابی کند واندازه وب نامرئی تقریبا ۵۰۰برابر وب مرئی است و کیفی از این نظر که منابع اطلاعاتی موجود در وب عمیق معمولا ارزشمند و مفید است و در بسیاری از موارد پاسخگوی نیاز کاربران می باشد. آشنایی با ابزارهایی که برای شناسایی منابع وب نامرئی به وجود آمده است، باعث دسترسی به این بخش عظیم از اطلاعات مفید وارزشمند می شود، مثل سایت Invisidlewed که فهرستی از منابع نامرئی و سایت Completeplaset که فهرستی از تقریبا ۴۰هزار پایگاه اطلاعاتی وب نامرئی را ارائه می دهد.بهتر است بدانید بهترین موتورهای جست وجو فقط قادر است حدود ۱۴درصد از اطلاعاتی را که روی شبکه جهانی وب قرار دارد، در دسترس قرار دهد. بنابراین ۸۶درصد اطلاعات خارج از دسترس موتورهای جست وجو است، اندازه وب پنهان۵۵۰بیلیون بزرگ تر از وب آشکار است.

حمید ضیایی پرور

منبع : روزنامه ابتکار

مطالب مرتبط

چگونگی رتبه بندی سایتها توسط موتورهای جستجو

چگونگی رتبه بندی سایتها توسط موتورهای جستجو
هر بار که شما توسط موتور جستجو، جستجویی انجام می دهید، عنکبوت(spider) آن به آهستگی از میان میلیون ها فهرست حرکت می کند و آنهایی را که بیشتر با مورد جستجوی شما ارتباط دارند را به تصویر می کشد. حتی میزان این ارتباط نیز مورد ارزشیابی قرار می گیرد تا مرتبط ترین سایتها در ابتدا به نمایش درآیند. البته موتور جستجو همواره درست عمل نمی کند. گاهی صفحات نا مربوط به چشم می خورند و در مواردی برای یافتن آنچه می خواهید باید جستجوی بیشتری انجام دهید. موتور جستجو در یافتن اطلاعات عمل شگفت انگیزی انجام می دهد. براستی موتورهای جستجو عمل ارزش گذاری ورتبه بندی را چگونه انجام میدهند ؟ پاسخ از این قرار است: توسط یک گروه دستورالعملها که الگوریتم خوانده می شوند.
هر موتور جستجو از گروه متفاوتی از الگوریتم ها استفاده می کند، اما همه آنها از اصول عمومی خاصی پیروی می کنند. از آنجا که موتورهای جستجو قصد دارند توجه مشتریان را مجدداًِ به خود جلب کنند، تلاششان بر این است که نتایج جستجوی مرتبط تری را پیدا کنند.یک راه برای دستیابی به این هدف توجه به مکان قرارگیری و تراکم عبارات جستجو یا کلمات کلیدی در یک صفحه وب است. موتور جستجو بررسی می کند که کلمات کلیدی در بخش عنوان(Title)، بخش سرآغاز(Head)، در ابتدای پاراگراف یا در متن آمده اند. فرض بر اینست که صفحات مرتبط با کلمات مورد جستجو، این عبارات کلیدی را برجسته تر و چشمگیرتر مورد استفاده قرار می دهند.
موتور جستجو تحلیل می کند که کلمات کلیدی در مقایسه با دیگر کلمات چند مرتبه به کار رفته اند.Meta tag ها نیزممکن است در تشخیص ارتباط نقش داشته باشند، هرچند بسیاری از موتورهای جستجو آنها را در نظر نمی گیرند و آن دسته که به آن اهمیت می دهند، ممکن است به صورتهای متفاوتی آنها را ارزشگذاری کنند.امکان دارد موتورهای جستجو، وب سایتها را بعلت Spamming جریمه یا تحریم کنند. کلمات کلیدی یکنواخت و خسته کننده، کلمات کلیدی تکراری در انتهای یک صفحه و ارائه کردن صفحه ای که به صورت اتوماتیک مخاطب را به صفحه ای با محتوای کاملا متفاوت هدایت کند، همه اشکالی از Spamming هستند. در پایان، موتورهای جستجو تحلیل ارتباط (Link Analysis) را نیز در مشخص کردن ارزشیابی خود به کار می برند. با تحلیل اینکه صفحات چگونه به یکدیگر متصل می شوند یک موتور جستجو می تواند مشخص کند که آن صفحه در چه مورد است و آیا آن صفحه به اندازه کافی مهم است که در رتبه بندی به حساب آید یا خیر؟
مهم است که به یاد داشته باشیم، با اینکه اکثر موتورهای جستجو از اصول یکسانی پیروی می کنند، الگوریتم های متفاوتی دارند. به این دلیل است که انجام یک جستجو در موتورهای جستجوی مختلف، نتایج بسیار متفاوتی به بار می آورد. برای مثال ممکن است برخی موتورهای جستجو تعداد بیشتری از صفحات وب را فهرست کنند و برخی دیگر در فاصله های زمانی کم تر این کار را انجام دهند.نتیجه نهایی اینکه هیچ دو موتور جستجویی فهرست یکسانی از صفحات وب ندارند. بنابراین رتبه بندی در موتورهای جستجو ممکن است بسیار متفاوت باشد.
به همین دلیل طراحان سایتهای وب، معمولا یک موتور عمده را هدف قرار می دهند و سعی می کنند طراحی سایت را به گونه ای انجام دهند که برای آن موتور خاص، مناسب تر باشد و رتبه بهتری داشته باشد و البته با این کار، به احتمال زیاد، رتبه در برخی موتورهای دیگر را از دست خواهد داد. حتی برخی از طراحان ممکن است موتورهای منطقه ای و تخصصی خاصی را هدف قرار دهند و برایشان امتیاز در موتورهای عمومی اهمیت نداشته باشد. شما باید قبل از اعمال هرگونه تنظیمات در سایت خود، اول به این نکته که کدام موتور جستجو را هدف قرار می دهید توجه کنید سپس سایت خود را برای بدست آوردن حداکثر امتیاز در آن موتور بهینه کنید.با توضیحات فوق، به نظر می رسد باید در مورد خدماتی که ادعا می کنند سایت شما را با اندک هزینه ای در صدها و هزاران موتور جستجو در مکان مناسبی قرار می دهند، بیشتر احتیاط کرد.

وبگردی
سرلشگر فیروزآبادی و ویلای 10هزار متری لواسان !
سرلشگر فیروزآبادی و ویلای 10هزار متری لواسان ! - لازم است ذکر شود جنبش عدالتخواه دانشجویی در صورت ادامه تعلل دستگاه‌های مربوطه در تخلیه ملک بیت‌المال، حق اقدامات انقلابی را برای اجبار فرد نامبرده به تخلیه ویلای لواسان، برای خود محفوظ می‌داند.
فیلم | مشکل مقبولیت و مشروعیت در کشور
فیلم | مشکل مقبولیت و مشروعیت در کشور - دکتر حمید ابوطالبی مشاور سیاسی رئیس جمهوری معتقد است که ما یک بار برای همیشه باید مشکل مشروعیت و مقبولیت را در کشور حل کنیم. این درست نیست که بخشی از نظام هم مشروع باشد هم مقبول اما بخش دیگری که از دل همین نظام در آمده است فقط مقبول باشد.
ماجرای تجاوز به 41 دختر از زبان امام جمعه ایرانشهر
ماجرای تجاوز به 41 دختر از زبان امام جمعه ایرانشهر - امام جمعه اهل سنت ایرانشهر : در ماه رمضان به ۴۱ دختر تجاوز شده که از این میان فقط ۳ دختر شکایت کرده اند.
فیلم مهران مدیری در برنامه خندوانه
فیلم مهران مدیری در برنامه خندوانه - برنامه کامل خندوانه با حضور مهران مدیری مهمان ویژه برنامه عید فطر برنامه خندوانه بود و این قسمت از مجموعه خندوانه را خاص کرد.
ویدئو / لطفاً در این مکان اعتراض کنید!
ویدئو / لطفاً در این مکان اعتراض کنید! - بر این اساس، ورزشگاه‌های دستگردی، تختی، معتمدی، آزادی، شیرودی، بوستان‌های گفت‌وگو، طالقانی، ولایت، پردیسان، هنرمندان، پارک شهر و ضلع شمالی ساختمان مجلس شورای اسلامی به عنوان محل‌های مناسب تجمع در تهران تعیین شده‌اند و از این پس معترضان می‌توانند در این محل‌ها تجمع کنند.
انتشار عکس دلخراش حمید بقایی
انتشار عکس دلخراش حمید بقایی - مشاور رسانه‌ای احمدی نژاد دیشب با انتشار عکسی دلخراش از وضعیت جسمی «حمید بقایی» از بازگشت این مجرم پرونده‌ی مالی آن دولت به زندان اوین خبر داد.
سبک عجیب شوی لباس در عربستان حاشیه ساز شد!
سبک عجیب شوی لباس در عربستان حاشیه ساز شد! - در پی برگزاری نمایش مد لباس زنان به سبکی عجیب در عربستان، سر و صدای بسیاری در رسانه ها به راه افتاد. ماجرا از این قرار بود که لباسها بدون مانکن و مانند اشباح در حال پرواز با استفاده از پهباد نمایش داده شدند.
ابداع مکتب «سیاست ورزی چرخشی» به نام ولایتی
ابداع مکتب «سیاست ورزی چرخشی» به نام ولایتی - علی اکبر ولایتی، مرد 37 شغله ای که به جز حوزه دیپلماسی، سالیانیست که کارشناس ادبی، فرهنگی، تاریخی، عرفانی و ... تلویزیون نیز هست، و هر سال دهها جلد کتاب به نام او منتشر می شود. همه ی این سوابق معششع یک سو و چرخش مادام سیاسی او در حوزه های مختلف، در سوی دیگر، کار را به جایی رسانیده که ولایتی را با ابداع مکتب «سیاست ورزی چرخشی» نیز می شناسند! ولایتی در تازه ترین تغییر مواضع خود این بار برجام را که روزگاری…
صحبت های تکان دهنده مادر یکی از دانش آموزان تجاوز شده
صحبت های تکان دهنده مادر یکی از دانش آموزان تجاوز شده - در این ویدئو صحبت های تکان دهنده مادر یکی از دانش آموزان تجاوز شده توسط معلم مدرسه را مشاهده می کنید.
افشاگری پوری بنایی درباره واقعیتی تلخ از ناصر ملک‌مطیعی
افشاگری پوری بنایی درباره واقعیتی تلخ از ناصر ملک‌مطیعی - پوری بنایی به عیادت پناهی رفت و دیدارش با مرحوم ناصر ملک‌مطیعی پس از پخش نشدن برنامه‌هایش از تلویزیون تعریف کرد.
(ویدئو) آزار جنسی گروهی دانش آموزان در مدرسه‌ای در غرب تهران!
(ویدئو) آزار جنسی گروهی دانش آموزان در مدرسه‌ای در غرب تهران! - ماجرای تکان دهنده اذیت و آزار گروهی دانش آموزان یک دبیرستان پسرانه در غرب تهران وارد فصل تازه‌ای شد.
آزاده نامداری هم گزارشگر فوتبال شد!
آزاده نامداری هم گزارشگر فوتبال شد! - در ادامه حضور چهره های شناخته شده در کمپین "خانم گزارشگر"، این بار آزاده نامداری مجری تلویزیون تلویزیون اقدام به گزارش فوتبال کرد. او برای این کار بازی خاطره انگیز ایران - استرالیا در مقدماتی جام جهانی 98 فرانسه را انتخاب کرده است که گزارش ضعیف او با انتقادات فراوانی مواجه شده است، تا حدی که وبسایت مربوط به این کمپین ویدئوی گزارش این او را از سایت حذف کرد.
عکسی عجیب و جنجالی از سید ابراهیم رئیسی
عکسی عجیب و جنجالی از سید ابراهیم رئیسی - عکسی از حضور سید ابراهیم رئیسی در مراسمی ویژه منتشر شده است که گفته می شود متعلق به کنفرانس افق نو در مشهد بوده است. در این عکس حرکات عجیب خانمی با لباس های قرمز، چفیه بر گردن و پرچم در دست در مقابل ابراهیم رییسی به چشم می خورد که توجه کاربران بسیاری را در شبکه های اجتماعی جلب کرده است!