سه شنبه ۲۶ تیر ۱۳۹۷ / Tuesday, 17 July, 2018

موتور های جستجو


موتور های جستجو
امروزه بر روی اینترنت و مهمترین سرویس آن ( وب )، صدها میلیون صفحه حاوی اطلاعات وجود دارد. کاربران اینترنت با آگاهی از آدرس یک سایت ، قادر به اتصال به سایت مورد نظر و استفاده از منابع اطلاعاتی موجود بر روی سایت خواهند بود. ما با دریائی از اطلاعات مواجه هستیم ، در صورتیکه قصد یافتن اطلاعاتی خاص را داشته باشیم ، از چه امکاناتی در این زمینه می توان استفاده کرد. ؟ برای جستجو و یافتن اطلاعات مورد نیاز از مراکز جستجوی اطلاعات در اینترنت استفاده می گردد . به مراکز فوق Search engines نیز می گویند.
مراکز جستجو در اینترنت ، نوع خاصی از سایت های موجود در وب بوده که با هدف کمک برای یافتن اطلاعات ، ایجاد شده اند. مراکز جستجو در اینترنت بمنظور پاسخگوئی به کاربران متقاضی و جستجوکنندگان اطلاعات از سه روش متفاوت استفاده می نمایند. نحوه عملکرد سه روش با یکدیگر مشابه بوده و تنها تفاوت موجود میدان انتخاب شده برای عملیات جستجو است .
▪ اینترنت و یا بخشی از آن بر اساس کلمات مهم ، جستجو می گردد.
▪ از کلمات پیدا شده یک ایندکس بهمراه محل مربوط به هر یک ، ایجاد می نمایند.
▪ به کاربران امکان جستجو برای کلمات خاص و یا ترکیبی از آنها که در فایل ایندکس موجود می باشند ، داده می شود.
مراکز جستجوی اولیه در اینترنت ، صرفا" اطلاعات مربوط به چندین هزار صفحه وب را ایندکس و روزانه دو تا سه هزار کاربر متقاضی به آنها مراجعه می کردند. مراکز جستجوی فعلی در اینترنت اطلاعات مربوط به صدها میلیون صفحه را ایندکس نموده و روزانه به بیش از دهها میلیون متقاضی پاسخ می دهند.
● وب
اغلب مردم زمانیکه از مراکز جستجو در اینترنت سخن می گویند ، منظور آنها مراکز جستجوی وب است . قبل از مطرح شدن وب ( مشهورترین بخش اینترنت ) ، از مراکز جستجوی اطلاعات برای کمک به کاربران برای یافتن اطلاعات استفاده می گردید. برنامه هائی نظیر : " gopher" و " Archie" از فایل های ذخیره شده بر روی سرویس دهنده های متصل به اینترنت ، یک ایندکس ایجاد می کردند. بدین ترتیب جستجو و دسترسی به اطلاعات و مستندات مورد نظر در اسرع وقت انجام می گردید. در اواخر سال ۱۹۸۰ اکثر کاربران مستلزم دارابودن دانش کافی در رابطه با استفاده از gopher,Archie و Veronica بودند. امروزه اکثر کاربران اینترنت دامنه جستجوی خود را محدود به وب نموده اند.
قبل از اینکه یک مرکز جستجو قادر به ارائه آدرس و محل فایل مورد نظر باشد ، می بایست فایل مورد نظر پیدا شود. بمنظور یافتن اطلاعات مربوط به صدها میلیون صفحه وب موجود ، مراکز جستجو می بایست از یک نرم افزار خاص با نام Spider ( عنکبوت ) برای ایجاد لیست های شامل کلمات موجود در هر یک از صفحات وب ، استفاده نمایند. فرآیند ایجاد لیست های مربوطه توسط Spider ، اصطلاحا" web crawling نامیده می شود. برای ایجاد و نگهداری یک لیست مفید از کلمات ، Spider های مراکز جستجو می بایست تعداد زیادی از صفحات وب را بررسی و مشاهده نمایند. نحوه حرکت Spider در وب به چه صورت است ؟ نقاط شروع ، لیستی از سرویس دهندگان با ترافیک و اطلاعات بالا و صفحات وب متداول است . Spider از یک سایت رایج عملیات خود را آغاز و پس از ایندکس نمودن کلمات موجود در صفحات وب ، هر یک از لینک های موجود در صفحات را برای ادامه حرکت خود انتخاب خواهد کرد. بدین ترتیب سیستم مبتنی بر Spider بسرعت حرکت خود در طول وب را آغاز خواهد کرد.
Google یکی از مراکز جستجوی دانشگاهی و معتبر است . در سیستم فوق از چندین Spider ( معمولا" سه Spider در هر لحظه ) برای ایجاد مقادیر اولیه برای سیستم ، استفاده می گردد . هر Spider قادر به نگهداری ارتباط خود با بیش از ۳۰۰ صفحه وب در یک لحظه است . با استفاده از چهار spider ، سیستم فوق قادر به جستجوی ۱۰۰ صفحه در ثانیه و تولید ۶۰۰ کیلوبایت اطلاعات در هر ثانیه است . اطلاعات مورد نیاز هر یک از spider ها می بایست بسرعت در اختیار آنان گذاشته شود. سیستم اولیه Google ، دارای یک سرویس دهنده اختصاصی بمنظور تغذیه آدرس های URL مورد نیاز برای هر یک از Spider ها بود. بمنظور افزایش سرعت عملیات ، Google از یک سیستم DNS اختصاصی استفاده می کرد. ( در سایر موارد از DNS مربوط به ISP استفاده می گردد ) . زمانیکه Spider به یک صفحه وب شامل تگ های Html برخورد می نماید ، دو آیتم در رابطه با آن را یاداشت خواهد کرد :
▪ کلمات موجود در صفحه
▪ محلی که کلمات پیدا شده اند.
از کلمات موجود در عنوان (title) ، زیرعناوین (Subtitles) ، تگ های متا و سایر مکانهای مهم یاداشت برداشته شده تا در آینده با توجه به خواسته کاربر ، امکان پاسخگوئی مناسب به آنها فراهم گردد. Spider مربوط به Google ، از کلمات موجود در هر یک از صفحات وب ایندکس ایجاد و کلماتی نظیر : "a" ، "an" و "the" را حذف می نمایند. سایر Spider ها هر یک دارای رویکردهای خاص خود در این زمینه می باشند.
سیاست های استفاده شده در رابطه با نحوه ایندکس نمودن اطلاعات صفحات وب ، مستقیما" بر سرعت عملکرد spider ها تاثیر گذاشته و به کاربران امکان جستجوی قدرتمندتر و کارآ را خواهد داد. مثلا" برخی از Spider ها ، علاوه بر نگهداری اطلاعات مربوط به عناوین و لینک ها ، یکصد کلمه با فرکانس تکرار بیشتر در صفحه وب و کلمات موجود در بیست خط اولیه را نیز نگهداری خواهند کرد. مرکز جستجوی Lycos از رویکرد فوق استفاده می نماید.
سیستم های دیگر نظیر " Altavista ، از روش خاص خود در این زمینه استفاده می نمایند. در سیستم فوق برای هر یک از کلمات موجود در صفحه شامل "a" ، "an" و "the" و سایر کلمات مشابه نیز ایندکس ایجاد می گردد.
● تگ های متا
با استفاده از تگ های متا ، ایجاد کنندگان صفحات وب می توانند کلمات کلیدی موجود در صفحه و نحوه ایندکس نمودن آن را مشخص نمایند. روش فوق در مواردیکه یک کلمه دارای بیش از یک معنی می باشد بسیار مفید و کارساز خواهد بود. بدین ترتیب تگ های فوق به مراکز جستجو راهنمائی لازم در خصوص انتخاب معنی مربوط به کلمات مورد نظر را خواهند داد. در این راستا ممکن است برخی از راهنمائی های انجام شده نیز اغفال کننده بوده و نتایج مثبتی را برای مراکز جستجو بدنبال نداشته باشد. بمنظور پیشگیری از راهنمائی های اغفال کننده توسط تگ های متا ، برنامه های Spider عملیات بازبینی محتویات یک صفحه وب را بمنظور تطبیق با اطلاعات ارائه شده توسط تگ ها ی متا ، انجام می دهند. اطلاعات نادرست ارائه شده بوسیله تگ های متا ، توسط Spider ها نادیده گرفته می شود.
تمام موارد فوق مفروض به حالتی است که ایجاد کننده صفحه وب قصد معرفی صفحه ایجاد شده خود را به مراکز جستجو دارد. در برخی موارد ممکن است تمایلی به انجام این کار وجود نداشته باشد.
● ایجاد ایندکس
پس از اینکه عملیات Spider ها در رابطه با یافتن اطلاعات به اتمام رسید ، ( عملیات فوق در عمل با توجه به ماهیت وب و استقرار صفحات وب جدید هرگز به پایان نخواهد رسید ، بنابراین همواره عملیات جستجو و یافتن اطلاعات توسط Spider ها انجام می گیرد) مراکز جستجو می بایست اطلاعات مورد نظر را بگونه ای ذخیره نمایند که قابل استفاده باشند. دو روش عمده در این راستا وجود دارد:
▪ اطلاعات بهمراه داده ذخیره گردند.
▪ با استفاده از روشی اطلاعات ایندکس گردند.
در ساده ترین حالت ، یک مرکز جستجو می تواند صرفا" کلمه و آدرس URL آن را ذخیره نماید. روش فوق در بازیابی اطلاعات و جستجو توسط کاربران ایجاد محدودیت خواهد کرد. با استفاده از روش فوق نمی توان جایگاه و وزن یک کلمه در یک صفحه وب را مشخص نمود. مثلا" نمی توان تشخیص داد که کلمه مورد نظر چند مرتبه در صفحه تکرار شده و یا لینک های موجود در صفحه نیز شامل کلمه مورد نظر می باشند یا خیر . بدین ترتیب امکان ارائه یک لیست از صفحات وب که شامل کلمه مورد نظر بر اساس میزان تکرار می باشند ، وجود نخواهد داشت .
بمنظور ارائه نتایج مفیدتر توسط مراکز جستجو ، اکثر مراکز جستجو صرفا" کلمه و آدرس URL را ذخیره نمی نمایند . در این حالت مواردی نظیر : تعداد تکرار کلمه در صفحه نیز ذخیره خواهد شد. مراکز جستجو همچنین به هر entry یک وزن را نسبت خواهند داد. وزن نسبت داده شده، نشاندهنده جایگاه کلمه در صفحه است ( ابتدای صفحه ، در لینک ها ، در تگ های متا و یا در عنوان صفحه ) هر یک از مراکز جستجو برای اختصاص یک وزن مناسب به کلمه مورد نظر از یک فورمول استفاده می نمایند. موضوع فوق یکی از دلایلی است که جستجو یک کلمه توسط دو مرکز جستجو ، نتایج مشابه ای را بدنبال نخواهد داشت .
مراکز جستجو بدلیل استفاده بهینه از فضای ذخیره سازی ، اطلاعات مورد نظر را بصورت رمز شده ذخیره می نمایند. مثلا" در نسخه اولیه سایت Google از دو بایت بمنظور ذخیره سازی اطلاعات مربوط به کلمات در یک صفحه استفاده می کردند. کلمات بصورت حروف بزرگ بهمراه اندازه فونت ، وزن و موقعیت آن ذخیره می گردید. هر یک از فاکتورهای فوق دو ویا سه بیت از دو بایت اشاره شده را به خود اختصاص می دادند. بدین ترتیب اطلاعات گسترده ای بصورت فشرده ذخیره و سپس عملیات ایجاد ایندکس انجام می گیرد.
ایندکس دارای صرفا" یک هدف است : امکان یافتن اطلاعات با سرعت بالا . برای ایجاد ایندکس از روش های متعددی استفاده می گردد. یکی از بهترین روش های موجود ، ایجاد یک جدول Hash است . در روش hashing ، از یک فورمول برای اختصاص یک عدد به یک کلمه استفاده می گردد. توزیع عددی با توزیع کلمات بصورت الفبائی با یکدیگر متفاوت بوده و همین امر ، موثر بودن جداول hash را بدنبال خواهد داشت . در زبان انگلیسی حروفی وجود دارد که کلمات زیادی با آنان آغاز می گردد. مثلا" بخش حرف "M" ، در یک دیکشنری بمراتب قطورتر از حرف "X" است . بدین ترتیب جستجو و یافتن کلماتی که با حرف M شروع می گردند زمان بمراتب بیشتری نسبت به یافتن کلماتی که با حرف "X" آغاز می گردند ، را طلب می کند. در روش hashing ، با آگاهی از موارد فوق، بگونه ای رفتار می گردد که متوسط زمان بازیابی هر کلمه کاهش یابد. در روش فوق ایندکس از داده واقعی متمایز می گردد. جدول hash ، شامل شماره hash بهمراه اشاره گری است که به داده مورد نظر اشاره می نماید. با ایجاد یک سیستم ایندکس مناسب و ذخیره سازی مطلوب اطلاعات ، امکان ارائه نتایج مفید برای کاربران را فراهم خواهد کرد.
● جستجو
کاربران برای جستجوی اطلاعات مورد نیاز ، پس از ورود به سایت مرکز جستجو ، یک query را ایجاد می نمایند. query می تواند ساده و صرفا" شامل یک کلمه و یا پیچیده و استفاده از عملگرهای منطقی باشد. برخی از عملگرهای منطقی عبارتند از :
▪ AND . تمام کلماتی که توسط AND بیکدیگر ملحق شده اند ، می بایست در صفحه موحود باشند. در برخی از مراکز جستجو از عملگر "+" بعنوان عملگر جایگزین AND نیز استفاده می شود.
▪ OR . حداقل یکی از کلماتی که توسط OR بیکدیگر ملحق شده اند ، می بایست در صفحه موجود باشد .
▪ NOT . کلمه بعد از NOT نباید در صفحه موجود باشد. برخی از مراکز جستجو از عملگر "-" نیز استفاده می نمایند.
▪ Followed by . یکی از کلمات می بایست مستقیما" پس از کلمه دیگر وجود داشته باشد.
● آینده مراکز جستجو
جستجوهائی که توسط عملگرهای منطقی تعریف می گردند از نوع جستجوهای literal می باشند. مراکز جستجو بمنظور ارائه نتایج مورد نظر کاربر ، دقیقا" کلمه و یا کلمات مشخص شده توسط کاربر در بانک اطلاعاتی جستجو می نمایند. روش فوق در مواردیکه یک کلمه دارای بیش از یک معنی باشد ، نتایج مثبتی را بدنبال نخواهد داشت . برای اخذ نتایج دلخواه ، کاربران اینترنت می توانند با استفاده از عملگرهای منطقی محدودیت هائی را ایجاد نمایند ، روش مناسب این است که محدودیت فوق از طریق مرکز جستجو اعمال گردد.
یکی از مواردیکه اخیرا" توسط محققین متفاوتی در مراکز جستجو دنبال می گردد ، جستجو بر اساس مفهوم است .در روش فوق با استفاده از آنالیزهای آماری بر روی صفحات شامل کلمات سعی در ارائه نتایج مطلوبتری وجود دارد. در برخی موارد دیگر استفاده از زبانهای طبیعی برای جستجو دنبال می گردد. در روش فوق برای طرح سوال خود از یک مرکز جستجو از روشی که توسط انسان برای طرح سوالات مربوطه استفاده می گیرد، استفاده خواهد شد. در این راستا ضرورتی به استفاده از عملگرهای منطقی و یا query های پیچیده نخواهد بود.


منبع : جنوبی‌ها

مطالب مرتبط

تکنیک های جست وجو در اینترنت

تکنیک های جست وجو در اینترنت
اینترنت را به زباله دانی بزرگ تشبیه کردهاند که در آن قطعات الماس یافت می شود منتهی اگر کسی روش زباله گردی در فضای اینترنت را نداند، احتمالا روزها و ماه ها در میان انبوه اطلاعات به درد نخور سرگردان خواهد شد و سرانجام بدون هیچ نتیجه مثبتی آن جا را ترک خواهد کرد.معمولا سخنی که از این دسته افراد شنیده می شود این است: اطلاعات مناسبی وجود نداشت. اما وبگردهای حرفه ای و کسانی که با روش ها و فوت و فن های جست وجو در اینترنت آشنایی دارند، هیچ وقت دست خالی از این فضای مجازی برنمی گردند آن ها همواره قطعات الماس را در میان انبوه زباله های اطلاعاتی تشخیص می دهند.
مهم ترین روش های جست وجو در اینترنت را تشریح کرده ایم:ابزارهای کاوش و جست وجو در وب را می توان به چند گروه تقسیم کرد که عبارت است از:
۱) فهرست راهنما یا دایرکتوری Directory
۲) شاهراه اطلاعاتی Gateway
۳) موتور جست وجو engine Search
۴) فراموتور جست وجو
۵) درگاه یا مدخل Metasearch
۶) وب نامرئی Wed Invisidle
● فهرست راهنما یا دایرکتوری
فهرست راهنما یا دایرکتوری که به آن فهرست موضوعی نیز گفته می شود، سایتی است که صفحات و سایت های مربوط به موضوعات گوناگون علمی و غیرعلمی را شناسایی و به صورت دستی دستهبندی می کند، از این رو اطلاعات طبقه بندی شده در فهرست راهنما از کیفیت خوبی برخوردار است و نتایج نامربوط در بین آن ها بسیار اندک می باشد. به جرات می توان گفت بزرگ ترین و معتبرترین فهرست راهنمای اینترنت در حال حاضر project birectory open می باشد که نشانی آنorg .zbmo.www است. جالب است بدانید بسیاری از موتورهای جست وجو مانند گوگل و Altavista در دایرکتوری خود از همین فهرست راهنما استفاده می کنند. از جمله فهرست های راهنمای دیگر می توان به com.adout و com.Yahoo اشاره کرد.
● شاهراه اطلاعاتی
شاهراه اطلاعاتی در واقع نوع تخصصی دایرکتوری است. یعنی اطلاعات طبقه بندی شده در شاهراه محدود به یک موضوع می باشد. مانند شاهراه اطلاعاتی جامعه شناسی. اما دایرکتوری یا فهرست راهنما در همه زمینه ها به جمع آوری و طبقه بندی اطلاعات می پردازد. معمولا شاهراه اطلاعاتی را استادان فن ارائه می کنند. از این نظر هرچند که ممکن است نشانی های موجود در آن اندک باشد، اما از اعتبار علمی بسیار بالایی برخوردار است. سایت com.acabemicinfo فهرستی از شاهراه های اطلاعاتی مربوط به رشته های مختلف علمی را دسته بندی کرده است.
● موتور جست وجو
"موتور جست وجو برنامه ای نرم افزاری است که با استفاده از کلیدواژه به جست وجوی منابع اطلاعاتی اینترنت می پردازد و فهرستی از مدارک واجد آن کلیدواژه را ارائه می دهد." موتورهای جست وجو نرم افزارهایی است که توسط رایانه ساخته شده و اطلاعات آن طبقه بندی موضوعی نشده است تمامی صفحات پشتیبانی شده براساس الگوریتم مشخص مرتب می شود و دارای اطلاعات وسیع عظیم و ارزیابی نشده می باشد.
محتویات یک موتور جست وجو در واقع همان بانک اطلاعات آن است. اما موتورهای جست وجو از شیوه های مختلفی برای جمع آوری و تشکیل بانک اطلاعاتی خویش بهره می برند و به همین دلیل نتایج جست وجوی یک واژه یا عبارت در موتورهای مختلف یکسان نیست.هر موتور جست وجو برای تعیین میزان تناسب و ارتباط واژگان جست وجو با صفحات واجد آن ها، از یک یا چند ملاک معتبر استفاده می کند. اما از بین معیارهای متعدد و رایج در میان موتورهای جست وجو ۲ معیار از اهمیت بیشتری برخوردار است.
▪ محل درج کلیدواژه:
چنان چه پیشتر نیز گفتم، یک صفحه وب از اجزا و عناصر مختلفی تشکیل شده است که اهمیت همه آن ها یکسان نیست. به طور کلی واژگان موجود در عنوان و خطوط اول صفحه یا سرتیتر در مقایسه با متن از اهمیت بیشتری برخوردار است.
▪ تعداد تکرار:
در اغلب موتورهای جست وجو در صفحاتی که واژگان جست وجو تکرار بیشتری داشته باشد، صفحات متناسبتر و مرتبط تر به حساب می آید.
▪ نوار ابزار جست وجو:
به جای مراجعه مستقیم به سایت اصلی جست وجوگر، می توانید نوار ابزار آن را در زیر نوار اصلی IE بگذارید. گوگل چنین ابزاری را به صورت یک on-abb دراختیار شما قرار می دهد.(به نشانی com.google.tooldar سربزنید) این ابزار امکانات دیگری مانند متوقف کننده popupها را نیز دارد.
▪ حذف از جست وجوها:
همه موتورهای جست وجو به شما این امکان را می دهد که نتایج جست وجو را به نحو مناسب محدود کنید. به عنوان مثال، وقتی در گوگل لغت خاصی را جست وجو می کنید، هزاران نتیجه به شما نشان داده می شود.راه حل محدود کردن نتایج جست وجو این است که از علامت ویژه در کنار عباراتی که مورد نظر شما نیست، استفاده کنید. به عنوان مثال بنویسید bogs-cats یعنی نتایج مرتبط با کلمه cats ▪ بدون bogsدر نظر گرفتن کلمات:
برخی جست وجوگرها برای محدود کردن نتایج جست وجو، کلمات اضافه و لغات کوچک را هنگام جست وجو مورد توجه قرار نمی دهند. به طور مثال از to، the،is،from صرف نظر می کنند. چنانچه فکر می کنید این کلمات در جست وجوی شما موثر است و منجر به کسب نتیجه بهتری از جست وجو می شود، می توانید آن ها را با گذاشتن یک علامت«» مشخص کنید.
▪ استفاده از گیومه:
وقتی که شما در جست وجویتان به دنبال یافتن یک عبارت مشخص هستید، ساده تر آن است که عبارت را داخل گیومه قرار دهید. به طور مثال عبارت مورد نظرتان را به صورت «.............»وارد کنید. نتیجه جست وجو فقط شامل عبارت داخل گیومه خواهد شد.
▪ به دنبال یک آدرس خاص:
چنان چه فقط بخشی از آدرس اینترنتی صفحه مورد نظرتان را می دانید، برای انجام جست وجوی سریع تر، می توانید کلمه ای را که مطمئن هستید در آدرس سایت وجود دارد، وارد کنید، به طور مثال عبارت worb:url را در جستوجوگر وارد کنید. نتایج جست وجو تنها شامل آدرس های اینترنتی خواهد شد که این کلمه خاص را در خود دارد.
▪ پیدا کردن سایت خودتان:
اگر یک سایت دارید، آیامی دانید که چه طور باید سایت هایی را که به سایت شما لینک داده اند، پیدا کنید در موتور جست وجو عبارتcom.yourwedabbress.www را وارد کنید و آدرس تمام سایت هایی که لینکی به سایت شما داده اند، ملاحظه کنید.
▪ پیدا کردن فایل:
در بسیاری از مواقع شما به فایلی احتیاج دارید که مشکلی از سیستم تان را برطرف می کند. برای یافتن آن نیازی نیست که هزاران صفحه وب را زیرورو کنید. با تایپ عبارت filename the:file در کادر جست وجو، یک فهرست از همه وب سایت هایی که نسخه ای از فایل مذکور را دارد، نمایش داده می شود. کاربرد این روش برای پیدا کردن فایل های تصویری نیز بسیار مفید است.
▪ ترفند پنهانی گوگل:
نوعی جست وجوی خاص نیز در گوگل وجود دارد، اگرچه همه از جزئیات آن خبر ندارند. گوگل به شما کمک می کند که در یک صفحه وب به دنبال کلمه بگردید که هم در URL و هم در آن صفحه وجود دارد. برای این منظور تایپ کنید Keyworb:url
▪ پیدا کردن تصاویر:
وقتی شما از موتور جست وجویی استفاده می کنید که برای جست وجوی تصاویر، پیش نمایشی از آن ها را نشان نمی دهد، ممکن است آدرس سایت هایی را برایتان بیابد که شامل عکس مورد نظرتان نباشد. برای نتیجه گیری سریع تر می توانید به نشانی com.google.image مراجعه کنید. در این جا کافی است نام شخص یا موضوع مورد نظر را وارد کنید. گوگل تصاویر بندانگشتی(thumdnail) در این رابطه را نمایش خواهد داد.
▪ پاسخی به سوالات:
به سایت com.ask.www سربزنید و پاسخ همه سوالات خود را در آن پیدا کنید. همچنین می توانید در این سایت به بیشترین مواردی که دیگران جست وجو کرده اند نیز نگاهی بیندازید.
▪ راهنمای گوگل:
در صفحه اصلی گوگل، گزینه جست وجوی پیشرفته(search Abvanceb) را کلیک کنید. در این جا می توانید نتایج جست وجویتان را محدود کنید. در بعضی مواقع دیدن صفحات وبی که مربوط به ۲یا۳سال قبل است، دیگر فایده ای ندارد. در این جا می توانید برای پیدا کردن صفحات جدیدتر گزینه ۳ماه، ۶ماه یا یک سال را انتخاب کنید.
▪ فراموتورهای جست وجو:
جست وجوی ترکیبی یا فراموتورها یا Metasearch برای حل مشکل جست وجوگرهای معمولی به کار گرفته می شود.برای مثال وب سایت داگ پایل(Dogpile) یا موتور آل دوب(allthewed) که در واقع نوعی جست وجوگر ترکیبی است، به شما امکان می دهد به آسانی در تمام جست وجوگرهای شناخته شده اینترنت، متن، عکس، صدا، فیلم، خبر یا کالای مورد نظر خود را بیابید. یافته های داگ پایل را می توان براساس نام جستوجوگری که آن اطلاعات را پیدا کرده است و یا براساس نزدیکی یافته ها به عبارت مورد نظر شما تفکیک کرد. همین طور در سمت چپ صفحه فهرستی از کلید واژه های مرتبط با چیزی که شما دنبال آن می گردید، ارائه می شود که خیلی وقت ها به کمک می آید. برای کسانی که در پی اطلاعات مربوط به شخص یا شرکت یا فروشگاهی به خصوص می گردند، جست وجو در کتاب های زرد و سفید هم امکان پذیر است.داگ پایل ابزار جست وجوی کوچکی هم دارد که اگر مایل باشید، می توانید به بالای صفحه مرورگر وبتان اضافه کنید تا جست وجو در آن آسان تر شود.
● موتورهای جست وجوی فارسی
انتخاب موتور جست وجو عامل مهمی در فرآیند جست وجو است. در حال حاضر ابزارهای کاوش مختلفی در ایران ظهور پیدا کرده است. لیکن ابزارهای جست وجویی که امکان جست وجوی اطلاعات به زبان فارسی را ارائه می کند، محدود است. از طرف دیگر،امکانات و قابلیت آن ها برای بازیابی موثر و مناسب اطلاعات متغیر است. برخی از ابزارهای کاوش با امکانات جست وجوی فارسی عبارت است از: ایران هو Iranhoo، پارسیکParseek، گوگل گوگلدر بین این ابزارهای کاوش، تنها موتور کاوش گوگل دارای برنامه روبات به منظور شناسایی و نمایه سازی صفحات یا سایت های وب به زبان فارسی و نمایه سازی خودکار می باشد و قادر است صفحات فارسی را در قالب یونی کد شناسایی و در پایگاه خود نمایه کند. سایت پارسیک نیز از پایگاه گوگل برای جست وجو و بازیابی اطلاعات استفاده می کند.
● وب نامرئی
اصطلاح "وب نامرئی" برای اطلاعاتی به کار می رود که روی شبکه جهانی وب است، اما با استفاده از موتورهای جست وجوی همه منظوره یافت نمی شود. وب نامرئی به ۲دلیل کمی و کیفی اهمیت دارد. کمی از این نظر که موتورهای جست وجو فقط قادر است حدود ۱۶درصد از اطلاعات موجود در اینترنت را بازیابی کند واندازه وب نامرئی تقریبا ۵۰۰برابر وب مرئی است و کیفی از این نظر که منابع اطلاعاتی موجود در وب عمیق معمولا ارزشمند و مفید است و در بسیاری از موارد پاسخگوی نیاز کاربران می باشد. آشنایی با ابزارهایی که برای شناسایی منابع وب نامرئی به وجود آمده است، باعث دسترسی به این بخش عظیم از اطلاعات مفید وارزشمند می شود، مثل سایت Invisidlewed که فهرستی از منابع نامرئی و سایت Completeplaset که فهرستی از تقریبا ۴۰هزار پایگاه اطلاعاتی وب نامرئی را ارائه می دهد.بهتر است بدانید بهترین موتورهای جست وجو فقط قادر است حدود ۱۴درصد از اطلاعاتی را که روی شبکه جهانی وب قرار دارد، در دسترس قرار دهد. بنابراین ۸۶درصد اطلاعات خارج از دسترس موتورهای جست وجو است، اندازه وب پنهان۵۵۰بیلیون بزرگ تر از وب آشکار است.

وبگردی
در حالی که همه دنیا فکر میکردند این آغوش جنسی است مطهری گفت مادرانه بود. ولی اشکال داشت !
در حالی که همه دنیا فکر میکردند این آغوش جنسی است مطهری گفت مادرانه بود. ولی اشکال داشت ! - وی در بخش دیگری از صحبت‌هایش با اشاره به نمایش در آغوش کشیدن تیم ملی کروواسی توسط رئیس‌جمهور کشورشان،گفت: ایشان با یک حس مادرانه این کار را انجام داد و این آغوش، جنسی نبود، البته که پخش آن نباید انجام می‌شد.
کدام پسر روحانی سه تابعیتی است؟
کدام پسر روحانی سه تابعیتی است؟ - سرنوشت فرزند بزرگ حسن روحانی از جمله مواردی است که در سال‌های گذشته بارها مورد توجه رسانه‌ها قرار گرفته است. پیش از برگزاری انتخابات ریاست‌جمهوری سال ۹۲ نیز یکی از وب‌سایت‌های اصولگرا مدعی بود که او به دنبال “شکست عشقی” دست به “خودکشی” زده است. بنا به ادعای برخی از رسانه‌های اصو‌لگرا، فرزند روحانی با کلت کمری پدر خودکشی کرد.
فیلم منزل محمود خاوری درکانادا
فیلم منزل محمود خاوری درکانادا - کاربران شبکه های اجتماعی فیلمی را منتشر کرده اند که گفته می شود مربوط به خانه مجلل محمود خاوری در کانادا است. صحت و سقم این قضیه هنوز تایید نشده است.
چرا آیت‌الله جنتی اینگونه فکر می‌کند؟
چرا آیت‌الله جنتی اینگونه فکر می‌کند؟ - احزاب و شخصیت‌ها - زندگی ساده آیت‌الله جنتی گرچه از ویژگی‌های مثبت شخصیت وی است اما نوع نگاهش به عرصه سیاسی و مصداق‌یابی های وی درخصوص افراد انقلابی انتقادهای زیادی را متوجه او می‌کند.
مائده هژبری و امیرحسین مقصودلو در استانبول
مائده هژبری و امیرحسین مقصودلو در استانبول - امیرحسین مقصودلو (تتلو) با انتشار عکسی از خودش و مائده هژبری، دختر نوجوانی که پس از اعتراف تلویزیونی اش معروف شد، از کنسرت مشترک در استانبول خبر داد.
واکنش فغانی به انتشار تصاویردست دادنش با داور زن برزیلی:کوچکترین اهمیتی برایم ندارد!
واکنش فغانی به انتشار تصاویردست دادنش با داور زن برزیلی:کوچکترین اهمیتی برایم ندارد! - تصاویر با شما سخن می گویند؛ تصاویری بی روتوش با سخنانی بی روتوش‌تر؛ می‌خواهیم با بخش خبری «فوتونیوز»، مقامات با شما بی روتوش و رودررو سخن بگویند. از این پس، عصرگاه هر روز با «فوتو نیوز» تابناک، حرف و سخن مقامات داخلی و خارجی را به عکس بی روتوش‌شان الصاق می‌کنیم، تا بهتر بدانیم چه کسی حرف زده و از چه سخن گفته است. کوتاه و مختصر؛ به احترام وقت شما و فرصتی که برای دانستن می‌گذارید.
اول مرگ بر ربا بعد مرگ برآمریکا
اول مرگ بر ربا بعد مرگ برآمریکا - صحبت های تامل برانگیز آیت الله رودباری درمورد ربا در کشور
مرد رو‌به‌روی مائده هژبری کیست؟
مرد رو‌به‌روی مائده هژبری کیست؟ - دختر بازداشت شده در بخشی از مصاحبه توضیح می‌دهد که صبح دستگیر شده و خانواده‌اش در جریان این موضوع قرار گرفته‌اند و این ادعا نشان می‌دهد تهیه فیلم اعترافات به فاصله یک صبح تا عصر انجام شده که خود نشان‌دهنده این است که برای متهم هنوز دادگاهی تشکیل نشده و جرمی به اثبات نرسیده ‌است.
فیلم | رامبد: دهنتو ببند، فرح‌بخش: دهنتو گِل بگیر!
فیلم | رامبد: دهنتو ببند، فرح‌بخش: دهنتو گِل بگیر! - پس از آنکه فیلم تازه محمدحسین فرح‌بخش در سالن‌های سینمای شهر تهران اکران نشد. احمدی مدیر سینماشهر که از قضا تهیه کننده برنامه خندوانه نیز هست و سوله مدیریت بحران شهر تهران در دوره تهیه کنندگی او به «خندوانه» اختصاص یافت، مانع از این اکران شده بود و همین مسئله واکنش فرح بخش را به دنبال داشت و او را رانت‌‎‌خوار خواند و پای رامبد جوان را به میان کشید.
شاخ‌های اینستاگرامی که نمی‌شناختیم
شاخ‌های اینستاگرامی که نمی‌شناختیم - یکی از دختران که به شدت مورد توجه قرار گرفته است مائده نام دارد. او از چهره‌های شناخته شده اینستاگرام است که ویدئو‌هایی از رقص هایش را در صفحه خود منتشر کرده است. او متولد سال 1380 است. به گفته خودش حدود 600هزار فالوئر دارد. او حالا با قرار وثیقه آزاد است.
تصادف سردار آزمون با پورشه اش (عکس)
تصادف سردار آزمون با پورشه اش (عکس) - سردار آزمون نیمه شب گذشته و در نزدیکی‌های صبح امروز با خودوری پورشه شخصی خود در محور نکا بهشهر پس از عبور از روستای کمیشان با تصادف زنجیره‌ای مواجه شد که در این حادثه خودروهای زیادی خسارت دیدند
فیلم | سرگذشت گنده‌لات تهران تا لحظه جان‌دادن در زندان (۱۴+)
فیلم | سرگذشت گنده‌لات تهران تا لحظه جان‌دادن در زندان (۱۴+) - فیلم - گزارشی کامل و کوتاه از سرگذشت وحید مرادی گنده‌لات تهران تا لحظه جان‌دادن در زندان را در ویدئوی زیر ببینید.
شوخی «عطاران» با «مدیری» در اکران فیلم هزارپا
شوخی «عطاران» با «مدیری» در اکران فیلم هزارپا - مراسم اکران خصوصی فیلم هزارپا با حضور هنرمندان و بازیگران این فیلم سینمایی شب گذشته 9 تیر 1397 در برج میلاد برگزار شد.
قصور تاریخی دولت
قصور تاریخی دولت - چه باید کرد؟ پرسشی که نوبخت پرسیده است، اما شاید به دنبال پاسخ آن نباشد. در شرایط کنونی دولت و حامیان اصلی آن در مظان این اتهام تاریخ قرار خواهند گرفت که چرا به دنبال طرح و پاسخ مهم‌ترین سوال شرایط بحرانی کنونی نرفتند.
تصاویر/ لمس "آزادی" در ورزشگاه آزادی
تصاویر/ لمس "آزادی" در ورزشگاه آزادی - مردم تهران برای اولین بار و برای تماشای مسابقه‌ی فوتبال ایران و اسپانیا در جام جهانی ۲۰۱۸ بهمراه خانواده‌های خود به ورزشگاه صدهزار نفری آزادی رفتند