سه شنبه ۱ آبان ۱۳۹۷ / Tuesday, 23 October, 2018

پرسشها و ابهامات Gmail


در چند سال اخیر با گسترش چشمگیر اینترنت در جهان، شركت‌های بسیاری به کسب‌وکار از طریق این دنیای مجازی پرداختند تا جایی كه، این کسب‌وکار به یكی از بزرگترین عرصه‌های رقابت در بین شركت‌های اینترنتی تبدیل شد و شركتهای زیادی تاسیس شد که فقط به بازاریابی در این دنیا پرداختند.
از آنجا که یكی از اركان مهم تجارت، جذب مشتری است، شركت‌هایی كه به کسب‌وکار در اینترنت می‌پردازند، نیاز به جذب بازدیدكننده برای سایت خود دارند تا محصولات و خدمات خود را معرفی کنند. این شركت‌ها از روش‌های مختلفی برای جذب مشتری و حفظ آن استفاده می‌كنند؛ یكی از بهترین این روشها ارایهٔ خدمات رایگان به مشتریان است. از جمله خدماتی كه در دنیای اینترنت به صورت رایگان ارائه می‌شود، می‌توان به امكان جستجو اشاره كرد؛ شركت‌های بسیاری در سایت‌های خود سرویس جستجو ارایه می‌کنند و هر كدام از آنها، با ارائهٔ خدماتی ویژه سعی در جذب مشتری بیشتر دارند.
در این میان، می‌توان به موتورهای جستجوگری چون yahoo, hotbot, AltaVista اشاره كرد كه از نظر قدمت در ردیف اول هستند؛ تا نیمهٔ دوم دههٔ نود، تنها این سایت‌ها به فعالیت در این زمینه مشغول بودند و تا آن زمان، رقابت میان آنها چندان پیچیده نشده بود. تا اینكه در این سالها، با ظهور گوگل، انقلابی در این زمینه بوقوع پیوست؛ گوگل با ارایهٔ خدمات مشتری‌پسندتر، بازار كار سایت‌های دیگر را به خطر انداخت و این امر موجب شد كه جستجوگرهای دیگر كه در این زمینه قدمت زیادی هم داشتند، به جنب و جوش بیفتند و به رقابت با این مدعی تازه بپردازند.
تاریخچهٔ گوگل
فناوری گوگل را دو دانشجوی مقطع کارشناسی‌ارشد رشتهٔ کامپیوتر دانشگاه استنفورد، در سال ۱۹۹۶ ابداع کردند و در واقع منشأ گوگل یک پروژه دانشجویی بود. در سال ۱۹۹۸، آن دو دانشجو که &#۰۳۹;سرگئی و برین&#۰۳۹; و &#۰۳۹;لری پیج&#۰۳۹; نام داشتند، محصول خود را با نام گوگل به ثبت رساندند و به موجب قراردادی که با دانشگاه استنفورد تنظیم کردند، سود آن را به سه قسمت مساوی بین گروه علوم کامپیوتری دانشگاه و خود تقسیم کردند؛ در سال‏های بعد نیز افراد دیگری در پروژه گوگل سرمایه‏گذاری کردند؛ به طوریکه دانشگاه استنفورد در حال حاضر سهمی کمتر از ۵درصد کل سهام را دارد که البته همین مقدار هم، بالغ بر ۲۵۰میلیون دلار می‌شود.
ویژگی‌های گوگل
قبل از گوگل، جستجوگرها دارای نواقص زیادی بودند و معمولاً به ارائه موضوعات نامربوط و همچنین ارائهٔ لینک‌هایی كه مدت‌ها از اعتبار آنها گذشته بود، می‌پرداختند. علاوه بر این، سرعت جستجو در آنها بسیار پایین بود. ولی گوگل با الگوریتمی جدید شروع به این كار نمود؛ این سایت در هر ۴۸ ساعت، كل فضای اینترنت را یكبار از نو جستجو و بیشتر صفحات آن را در فضای خود ذخیره می‌كرد.
به این ترتیب هم می‌توانست خدمات را با سرعت بیشتری (از روی سرور خود) ارایه كند و هم اینكه هر ۴۸ ساعت، لینک‌های بی‌اعتبار را از سرور خود خارج کند. گوگل از همان ابتدای كار با انجام اقدامات انقلابی و ارائه خدمات جدید، همچون جستجو به زبان‌های مختلف، جستجوی عكس و اخبار و ترجمهٔ سایت‌ها به زبان‌های پرطرفدار دنیا، روزبه‌روز به طرفداران خود می‌افزود. این فعالیت‌ها به قدری مورد توجه عموم قرار گرفت كه با وجود جنب و جوش سایر سرورها، گوگل در مدتی كمتر از یک سال (در سال ۹۹) ششمین جستجوگر پربینندهٔ‌ دنیا شد و طبق آخرین اخبار، در حال حاضر ۴۸درصد جستجوها به‌وسیلهٔ این سایت انجام می‌شود.
این اقدامات انقلابی و ارایهٔ خدمات منحصر به‌فرد، هنوز ادامه دارد؛ راه‌اندازی موتور جستجوگر فعال، كه ایجاد سایتی جدید با آن موضوع را به افراد درخواست‌كننده اطلاع می‌دهد؛ راه‌اندازی orkut كه همچون groupهای yahoo است، ولی با امكاناتی جدیدتر و متنوع‌تر؛ راه‌اندازی G-mail كه شاید دومین حملهٔ موفقیت‌آمیز گوگل بود و نیز انتشار اخباری در مورد راه‌اندازی messenger که از آخرین اقدامات گوگل است. در ادامه به مهمترین این انقلاب‌ها، یعنی G-mail و جنبش باورنكردنی که در دنیای اینترنت به راه انداخته است، می‌پردازیم.
G-mail، صندوق‌پستی پرنشدنی
G-mail با طرح ایده‌های جدید و شعارهای نو و مشتری‌پسند که تا قبل از آن، فرد دیگری از آنها سخن به میان نیاورده بود، مبارزه برای جذب مشتری را از نو آغاز کرد. شعارهای G-Email عبارتند از:
۱- جستجو كنید و مرتب كنید؛
۲- هیچ چیز را دور نیاندازید؛
۳- پیغام‌هایتان را مرتب شده، در كنار هم ببینید؛
۴- از شر تبلیغات تصویری پرحجم خلاص شوید.
گوگل در خبری كه در اول آوریل ۲۰۰۴ منتشر كرد، اعلام نمود یك گیگابایت فضای مجانی صندوق پستی به كاربران خود ارائه می‌دهد. صاحبان این سایت ادعا كردند برای كاربران تبلیغ تصویری نمی‌فرستد؛ بلكه لیستی از تبلیغات مرتبط با موضوع نامه و آن هم به صورت نوشتاری در اختیار بازدیدكنندگان قرار می‌دهند و این در حالی است كه تا قبل از این، بزرگترین سرورهای پست‌الکترونیکی دنیا، مثل yahoo و hotmail، فضایی كمتر از ۴مگابایت را به صورت مجانی را اختیار هر كاربر قرار می‌دادند و برای اختصاص فضای بیشتر، از كاربران خود پول دریافت می‌كردند.این خبر تا حدی برای این سرورها و همچنین مردم تعجب‌آور بود، بلافاصله خبرهای گوناگونی در تكذیب این ادعای گوگل و نسبت دادن آن به دروغ اول آوریل در محافل و سایت‌های مختلف خبری منتشر شد. روزنامهٔ گاردین در شمارهٔ ۱۷ آوریل نوشت: یك گیگابایت فضای رایگان برای پست الكترونیك!! آیا امكان‌پذیر است؟
آیا واقعاً امکان‌پذیر است؟
گوگل هنوز به طور کامل G-mail را راه‌اندازی نکرده و تنها آن را به صورت آزمایشی به کاربران فعال bloggerهای خود ارائه داده است. بررسی‌ها نشان می‌دهد که علت این تأخیر، عملی نبودن این ماجرا نیست؛ بلکه علت آن را باید در سیاست‌های گوگل جستجو کرد.
برای بررسی امكان‌پذیری این موضوع باید به چند نكته توجه کرد:
۱- بعد از پخش خبر ادعای گوگل در دنیا، شركت دیگری به نام SpyMac نیز ادعاکرد که چنین فضایی را به کاربران می‌دهد و هم‌اكنون نیز اقدام به ارائه این خدمات كرده است. هر چند خدمات این سایت، از نظر كیفیت و نحوهٔ ارائهٔ‌ خدمات در مقابل ادعای گوگل قابل مقایسه نیست، اما نشان می‌دهد چنین امری امکان دارد.
۲- ذخیرهٔ حجم زیادی از اطلاعات، كار جدیدی برای گوگل نیست؛ همانطور كه گفتیم گوگل حجم زیادی از دنیای اینترنت را به صورت cash در خود ذخیره كرده است.
۳- از آنجا که کاربران از بدو ورود تمام یك گیگابایت فضا را مصرف نمی‌كنند، لازم نیست كه از همان ابتدا به همه افراد یك گیگابایت فضا اختصاص داده شود و این امر در طول زمان انجام می‌گیرد؛ اگر گوگل بتواند جلوی استفاده‌های دیگر غیر از نامه‌های الکترونیکی را بگیرد، حدود ۱۰۰ سال طول می‌كشد كه این فضا پر شود؛ هر گیگابایت حدود ۵۰۰هزار نامه را در برمی‌گیرد و اگر هر فرد روزانه به طور متوسط ۱۵ پیام دریافت كند، پرشدن این فضا حدود ۱۰۰ سال طول می‌كشد؛ پس به راحتی می‌توان دید كه این فضا عملاً پر نمی‌شود.۴- گوگل ادعا كرده است كه یك نسخه از تمام نامه‌های الکترونیکی را در سرور خود نگه می‌دارد و حتی اگر افراد هم آن را از صندوق پستی خود پاك كنند، ممكن است كه این اطلاعات از سرور گوگل پاك نشود.
این موضوع اگرچه به این معنی است که کاربران امکان نابود کردن هیچ سندی را که یک‌بار به گوگل سپرده‌اند ندارند و ممکن است مشكل امنیتی برای افراد ایجاد كند، اما موجب می‌شود كه فضای كمتری توسط نامه‌های الکترونیکی تكراری اشغال شود. طبق بررسی انجام شده، حجم بسیاری از فضای سرورها را نامه‌های الکترونیکی تكراری، كه افراد برای هم forward می‌كنند، تشكیل می‌دهد. این اقدام گوگل از اتلاف فضا به منظور ذخیرهٔ‌ نامه‌های الکترونیکی تكراری جلوگیری می‌كند.
۵- اگر فرض كنیم كاربران G-mail از همان ابتدا ۱میلیارد نفر (یک‌ششم جمعیت كل جهان) باشند كه هر كدام تمام یك گیگابایت فضای خود را استفاده كنند، در مجموع به یك میلیارد گیگابایت حافظه نیاز است. با توجه به پیشرفت تكنولوژی‌های ذخیره‌سازی، می‌توان ۲۵۰ گیگابایت را با استفاده از تکنولوژی falashII در فضایی برابر ۳۸×۲۳۴×۱۳۳ میلیمتر مكعب ذخیره کرد. بنابراین برای یك میلیارد مگابایت، چهار میلیون حافظهٔ flashII نیاز خواهیم داشت. یعنی فضایی برابر ۴۷۳۰ مترمكعب كه اگر ارتفاع فضا را ۳ متر (یك ساختمان معمولی) در نظر بگیریم، به حدود ۱۶۰۰ مترمربع فضا نیاز است.
دیگران چه خواهند کرد؟
همانطور که اشاره کردیم، این اخبار موجب جنب و جوش سرورهای پست الکترونیکی دیگر شده است. پس از اینکه گوگل به صورت محدود به ارائهٔ G-mail پرداخت، yahoo برای مقابله با آن، ظرفیت صندوق پستی هر کاربر را تا ۱۰۰ مگابایت و به صورت مجانی افزایش داد و هم‌اکنون شاهد این افزایش فضا و تغییرات دیگری در yahoo هستیم که البته اشکالاتی در آن مشاهده می‌شود. در این بین، اخباری که از شرکت مایکروسافت به گوش می‌رسد، بسیار جالب است؛ بیل گیتس که خود از مخالفان ارایهٔ خدمات مجانی است و حتی پیشنهاد کرده بود که برای ارسال e-mail نیز از فرستنده پول دریافت شود، اعلام کرده است که فضای ۲مگابایتی Hotmail را به ۲۵۰ مگابایت افزایش خواهد داد. با وجود این، هنوز ناباوری در مورد ارایهٔ خدمات مجانی گوگل و هدف ارایهٔ این‌ خدمات وجود دارد؛ علاوه بر آن، در مورد همچنین تأمین مخارج آن سؤال‌هایی وجود دارد.
کلید این صندوق در دست کیست؟
مسئله مهم دیگر در این رابطه، مسئله امنیت اطلاعات است؛ گوگل در صفحهٔ‌ privacy مربوط به G-mail، ادعا كرده است كه به طور معمول، اطلاعات افراد توسط هیچ شخصی خوانده نمی‌شود و رده‌بندی این اطلاعات و موضوع‌بندی آنها تماماً توسط كامپیوتر صورت می‌گیرد و همچنین ادعا نموده است كه این اطلاعات را در اختیار شركت‌های دیگر قرار نمی‌دهد. ولی كمی بعد از این ادعاها، چیزهای دیگری به چشم می‌خورد.اگرچه گوگل ابتدای این صفحه را با این شعارهای زیبا شروع كرده است، ولی چند خط پایین‌تر، در مورد مواردی كه گوگل اجازه دارد از اطلاعات افراد استفاده كند، مطالبی آمده است كه تمام مطالب بالا را زیر سؤال می‌برد. مثلاً اعلام شده است که اگر گوگل شك كند که کاربر اقدام به ارایه مطالبی بر علیه گوگل یا شركت‌های تابعه کند یا كارهایی برخلاف قوانین انجام دهد، مثلاً اقدام به ارسال Spam كند، گوگل حق دارد به بررسی مطالب وی بپردازد.
همچنین این سایت اطلاعات شخصی فرد را می‌تواند در اختیار دولتمردان قرار دهد؛ ضمناً تضمین نمی‌كند كه این اطلاعات در سرور گوگل در كشور کاربر بماند و بر این موضوع تاکید كرده است كه این اطلاعات به سرور گوگل در آمریكا فرستاده شده و در آنجا نگهداری می‌شود. همچنین اعلام کرده است كه این اطلاعات را می‌تواند در اختیار شركت‌های متعلق به گوگل قرار دهد.
G-Email، صندوقچهٔ اسرار
واقعیت چیست؟! چرا G-mail هنوز به‌طور کامل راه‌اندازی نشده است؟ هدف از این خدمات چیست؟ آیا گوگل می‌خواهد علاوه بر بلعیدن بیشتر فضای اینترنت در سرور خود، فضای mail، یعنی اطلاعات شخصی مردم را نیز ببلعد؟ آیا این كار، گوگل را به پایگاه اطلاعات مردم دنیا تبدیل نمی‌كند؟ آیا هدف گوگل، راه‌اندازی یك مركز جاسوسی در مورد مسایل خصوصی مردم نیست؟ آیا این شركت، به‌وسیلهٔ ابرقدرت‌های دنیا اداره می‌شود و هزینهٔ‌ آن را این دولتها تقبل می‌كنند؟ آیا گوگل فقط با ارائه تبلیغات نوشتاری می‌تواند هزینه‌های هنگفت این تسهیلات را تأمین كند؟
آیا آینده، همه مسایل را روشن می‌کند؟! اگر جواب این سوال‌ها را هم ندانیم، باز هم در سایهٔ این جنگ بزرگان اینترنت، می‌توانیم راحت‌تر و ارزان‌تر زندگی کنیم.


منبع: نشریهٔ طیف دانشگاه صنعتی امیرکبیر


منبع : شرکت مخابرات استان تهران

مطالب مرتبط

نگاهی به موتورهای جست وجو در اینترنت

نگاهی به موتورهای جست وجو در اینترنت
حتماً شما هم بارها، زمانی که به یک مقاله علمی، سیاسی و... نیاز داشته اید یا حتی برای یافتن معنی اصطلاحی، پشت کامپیوترتان نشسته اید و با استفاده از اینترنت در مدت زمان کوتاهی آن را پیدا کرده اید. اما آیا تابه حال فکر کرده اید چگونه در عرض چند ثانیه انبوهی از اطلاعات در اختیار شما قرار می گیرد؟ صدها میلیون صفحه در اینترنت در دسترس وجود دارند و منتظر هستند تا اطلاعات را با تنوع شگفت انگیزی از موضوعات ارائه دهند. زمانی که شما می خواهید در مورد یک موضوع مخصوص اطلاعات کسب کنید، چگونه می دانید که چه صفحاتی را باید بخوانید؟ احتمالاً مانند اکثر مردم، شما از یک موتور جست وجوی اینترنت بازدید می کنید.
موتورهای جست وجوی اینترنتی، سایت های مخصوصی در شبکه هستند و طوری طراحی شده اند که به افراد کمک می کنند تا اطلاعات مورد نیازشان را که در سایت های دیگر ذخیره شده است بیابند. تفاوت هایی در شیوه عملکرد موتورهای جست وجوی مختلف وجود دارد، اما همه آنها سه وظیفه اصلی را انجام می دهند:
۱) در اینترنت، یا بخش های برگزیده ای از اینترنت، براساس کلمات مهم جست وجو را انجام می دهند.
۲) یک فهرست از کلماتی که پیداکرده اند و جایی که آنها را پیدا کرده اند، تهیه می کنند.
۳) این امکان را برای کاربران فراهم می کنند تا کلمات یا مجموعه ای از کلمات مورد نظر خود را که در فهرست یافت می شود جست وجو کنند.
موتورهای جست وجوی اولیه یک فهرست شامل تنها چندصد هزار صفحه و فایل نگهداری می کردند و در روز شاید یک یا دو هزار بازدیدکننده داشتند. امروزه یک موتور جست وجوی خوب، صدها میلیون صفحه را فهرست می کند و در روز پاسخگوی ده ها میلیون جست وجو کننده است. حالا باید ببینیم چگونه این مسئولیت مهم انجام می شود و چگونه موتورهای جست وجوی اینترنتی، بخش های مختلف را به کار می برند تا ما بتوانیم اطلاعات مورد نیاز خود را در شبکه بیابیم.
● جست وجو میان صدها میلیون صفحه
قبل از اینکه یک موتور جست وجوگر بتواند به شما بگوید که یک فایل در کجا قرار دارد، باید آن فایل پیدا شود. یک موتور جست وجوگر برای یافتن اطلاعات از میان صدها میلیون صفحه که در شبکه وجود دارند، روبات نرم افزاری خاصی به نام spiders را به کار می گیرد تا لیستی از کلماتی که در سایت های شبکه یافت می شود را ایجاد کند. فرآیندی که یک spider لیست خود را ایجاد می کند، Web crawling نامیده می شود. برای ایجاد و نگهداری یک لیست مفید و مناسب از کلمات، یک spider موتور جست وجوگر باید صفحات بسیار زیادی را بررسی کند. چگونه هر spider مسیرش را در شبکه آغاز می کند ؟ معمولاً نقطه شروع، لیستی از صفحاتی است که توسط سرورها زیاد استفاده می شوند و همچنین صفحاتی که عمومی تر و معروف تر هستند. spider از یک سایت عمومی شروع می کند، کلمات موجود در صفحات آن را لیست می کند و هر لینکی که در آن سایت یافت می شود را دنبال می کند. به این طریق سیستم جست وجوگر به سرعت شروع به حرکت می کند و در بخش هایی که بیشتر از همه مورد استفاده قرار می گیرد حرکت می کند.
Google.com به عنوان یک موتور جست وجوگر علمی آغاز به کار کرد. سرجی برین و لورنس پیج بیان کرده اند که spiderهای سیستم آنها با چه سرعتی می توانند کار کنند. آنها سیستم اولیه خود را به گونه ای ساختند که از چندین spider استفاده کند، معمولاً سه تا در یک زمان. هر spider می توانست با حدود سیصد صفحه شبکه که در یک زمان باز بودند اتصال برقرار کند. در بهترین عملکرد خود، با استفاده از چهار spider، این سیستم می توانست در هر ثانیه به صد صفحه متصل باشد و حدود ۶۰۰ کیلو بایت داده را در هر ثانیه ایجاد کند. برای سرعت بخشیدن به جست وجو، ایجاد سیستمی برای ارائه اطلاعات لازم به spider لازم است. سیستم گوگل اولیه دارای سروری بود که به فراهم کردن URL ها برای spider ها اختصاص یافته بود. به جای وابسته بودن به یک فراهم کننده سرویس اینترنتی برای DNS که نام یک سرور را به یک آدرس تبدیل می کند، گوگل DNS خودش را داشت تا تاخیرها را به حداقل برساند.
زمانی که spider گوگل یک صفحه HTML را مشاهده می کرد، به دو نکته توجه می کرد: کلمات درون صفحه، در کجا کلمات پیدا شده اند.
کلماتی که در عنوان اصلی یا عناوین فرعی و یا سایر موقعیت هایی که دارای اهمیت نسبی هستند، قرار دارند برای جست وجوی بعدی کاربر مورد توجه خاص قرار می گرفتند. spider گوگل هر کلمه معنی داری در صفحه را فهرست می کرد و از کلمات a an, the صرف نظر می کرد. سایر spider ها از روش های متفاوتی استفاده می کردند. در کل تمامی این روش ها معمولاً سعی می کند تا عملکرد spider را سریع تر کند، به کاربران اجازه بدهد تا با کارایی بهتر و بهینه تر جست وجو کنند و یا هر دو آنها. به عنوان مثال، بعضی spider ها کلماتی که در عنوان ها، عنوان های فرعی و لینک ها وجود دارند یا کلماتی که بارها در صفحه تکرار می شوند و هر کلمه ای در بیست خط اولیه متن را نگهداری می کند. سایت Lycos از این روش استفاده می کند.
سایر سیستم ها، از قبیل AltaVista، هر کلمه در صفحه، شاملa an, the و سایر کلمات که بی اهمیت هستند را هم لیست می کنند.
● ایجاد فهرست
زمانی که spider ها وظیفه یافتن اطلاعات از صفحات شبکه را به اتمام رساندند (البته باید در نظر داشته باشیم که این وظیفه هرگز واقعاً تمام نمی شود، خاصیت تغییر دائمی شبکه به این معنی است که spiders ها همیشه در حال حرکت و جست وجو هستند)، موتور جست وجو باید این اطلاعات را به شکلی که مفید باشد، ذخیره کند. دو مولفه کلیدی برای در دسترس قرار دادن اطلاعات جمع آوری شده برای کاربران وجود دارد: اطلاعات ذخیره شده با داده ها - روشی که توسط آن اطلاعات فهرست می شود.
در آسان ترین حالت، موتور جست وجوگر می تواند تنها کلمه و URL را ذخیره کند. در حقیقت، این روش برای موتوری با کاربرد محدود است، زیرا در این حالت راهی وجود ندارد برای اینکه تعیین کند آیا کلمه در بخش مهم یا بخش بی اهمیتی از صفحه استفاده شده است، آیا کلمه تنها یک بار یا چندین مرتبه تکرار شده است یا صفحه لینک هایی به صفحات دیگری که شامل آن کلمه هستند، دارد. به عبارت دیگر راهی برای ایجاد لیستی رتبه بندی شده که تلاش می کند تا مفیدترین و بهترین صفحات را در بالای لیست نتایج جست وجو قرار بدهد، وجود ندارد.
برای به دست آوردن نتایج بهتر، بیشتر موتورهای جست وجو اطلاعات بیشتری علاوه بر کلمه و URL ذخیره می کنند. موتور ممکن است تعداد دفعاتی که کلمه در صفحه تکرار شده است را ذخیره کند، یا ممکن است مقداری را به هر ورودی اختصاص بدهد و زمانی که کلمات در عناوین، عنوان های فرعی و لینک ها ظاهر می شوند ارزش اختصاص یافته به آنها بیشتر می شود. هر موتور جست وجوگر تجاری، فرمول متفاوتی برای ارزش گذاری کلمات فهرست خود دارد. این مسئله یکی از دلایلی است که موجب می شود جست وجوی یک کلمه در موتورهای جست وجوگر متفاوت، لیست های متفاوتی را ارائه بدهد و صفحاتی با ترتیب های متفاوت ارائه شود.
داده ها برای صرفه جویی در فضای ذخیره سازی رمزگذاری می شوند. مثلاً در صفحه گوگل اطلاعاتی از قبیل اینکه آیا کلمه با حروف بزرگ بوده است، اندازه فونت آن، موقعیت کلمه و سایر اطلاعاتی که به رتبه بندی آن کمک می کند را به صورت بیت و بایت ذخیره می کند. در نتیجه میزان بسیار زیادی از داده ها می تواند به شکل بسیار فشرده ای ذخیره شود. بعد از اینکه اطلاعات فشرده شد، برای فهرست شدن آماده است.
هدف از ایجاد یک فهرست این است که باعث شود تا بتوانیم اطلاعات را با سریع ترین حالت ممکن پیدا کنیم. به طور کل، تنها چند راه برای ایجاد فهرست وجود دارد، اما یکی از مهمترین و موثرترین روش ها، ایجاد جدول hash است. در این روش فرمولی به کار می رود تا به هر کلمه یک ارزش عددی اختصاص بدهد.
پرسش و جست وجوی انجام شده توسط کاربر می تواند خیلی ساده باشد، حتی یک کلمه. برای پرسش های پیچیده تر لازم است تا از عملگرهای بولین (AND, OR, NOT, NEAR,) و... استفاده کنید تا بتوانید شرایط جست وجو را گسترش بدهید.
به طور خلاصه عملکرد یک موتور جست وجو به این صورت است: نرم افزار spider با جست وجو در سایت های مختلف لیستی از کلمات و جایی که قرار دارند فراهم می کند، سپس براساس سیستم ارزش گذاری خود فهرستی رتبه بندی شده تهیه می کند، داده ها را رمزگذاری می کند و سرانجام اطلاعات را برای دسترسی کاربران ذخیره می کند.
● آینده موتورهای جست وجوگر
در جست وجوهایی که از عملگرهای بولین استفاده می شود، جست وجوهای لفظی است. موتور دقیقاً همان کلمات یا عبارتی که وارد شده است را جست وجو می کند. زمانی که کلمات ورودی دارای چندین معنی هستند، جست وجوی صحیح آنها مشکل است. در این حالت، اگر برای شما تنها یکی از معانی آن کلمه مهم باشد، احتمالاً شما نمی خواهید سایر صفحات را که شامل معانی دیگر کلمه است ببینید. شما می توانید یک جست وجوی لفظی ایجاد کنید که تا حدودی معنی های ناخواسته را حذف کند، اما بهتر این بود که خود موتور جست وجو می توانست این کار را انجام بدهد.
یکی از حوزه های تحقیق در موتورهای جست وجوگر، جست وجو براساس مفهوم است. به عنوان مثال، استفاده کردن از تحلیل های آماری صفحاتی که شامل کلمات یا عباراتی است که شما جست وجو می کنید، برای اینکه صفحات دیگری را که ممکن است شما به آن علاقه داشته باشید پیدا کند. بدیهی است که در یک موتور جست وجوگر مبتنی بر مفهوم، اطلاعات ذخیره شده برای هر صفحه، بیشتر است. هنوز بسیاری از گروه ها تلاش می کنند تا نتایج و عملکرد این نوع از موتورهای جست وجو را افزایش دهند. قلمرو دیگری که پژوهشگران درباره آن تلاش می کنند، پرسش ها به زبان طبیعی نامیده می شود. منظور از این پژوهش این است که شما بتوانید پرسش تان را به گونه ای تایپ کنید مثل اینکه آن را از شخصی که کنار شما نشسته است می پرسید و نیازی نباشد تا از عملگرهای بولین یا ساختارهای پیچیده برای پرسش استفاده کنید. معروف ترین سایت جست وجو به شیوه پرسش به زبان طبیعی، سایت AskJeeves.com است. این سایت تنها با جملات ساده کار می کند، اما تلاش بسیاری انجام می شود تا این روش جست وجو گسترش یابد تا بتواند سئوالات پیچیده تر را هم بپذیرد.
همچنان تلاش های بسیاری برای افزایش کیفیت و ارائه خدمات بیشتر موتورهای جست وجوگر انجام می شود و هر روز شاهد خبرهای جدیدی در این زمینه هستیم و رقابت بین سایت های دارای موتور جست وجوگر بیشتر و بیشتر می شود.
لیستی از سایت های مهم دارای موتور جست وجو
▪ AltaVista
▪ Dogpile
▪ Go
▪ Google
▪ HotBot
▪ Looksmart
▪ Lycos
▪ Mamma
▪ Metacrawler
▪ Northern Light
▪ Open Directory Project
▪ Search.com
▪ NBCi
▪ WebCrawler
▪ Yahoo

وبگردی
فیلم | دستگیری ۳ مرد با لباس زنانه در مسیر پیاده‌روی اربعین!
فیلم | دستگیری ۳ مرد با لباس زنانه در مسیر پیاده‌روی اربعین! - ۳ مرد با لباس زنانه در مسیر پیاده روی اربعین دستگیر شدند. دادستان شهرستان حمیدیه استان خوزستان گفت: افرادی که شامگاه گذشته در مسیر راهپیمایی اربعین حسینی دستگیر شده اند، هیچگونه انگیزه امنیتی نداشته اند. علی بیرانوند به ایرنا گفته بعد ازظهر جمعه ماموران انتظامی حمیدیه به یک خودروی پراید مشکوک شدند که پس از متوقف کردن آن متوجه شدند 6سرنشین مرد داشته که سه نفرشان پوشش زنانه دارند. این افراد برای تحقیقات…
فیلم | رسوایی جدید در رسانه ملی؛ مقصر فریب مردم کیست؟
فیلم | رسوایی جدید در رسانه ملی؛ مقصر فریب مردم کیست؟ - فیلم - پدری که در برنامه «فرمول یک» علی ضیا ادعا کرد به خاطر تامین هزینه‌های درمان فرزندش اقدام به فروش کلیه‌اش کرده، مردم را فریب داده است.
«بیان واضحات و تکرار مکررات» ؛ نتیجه 7 سال بودجه و تشکیلات و همایش و جلسه!
«بیان واضحات و تکرار مکررات» ؛ نتیجه 7 سال بودجه و تشکیلات و همایش و جلسه! - مثلاً سنت های الهی که در این سند آمده، در کتاب های درس بینش اسلامی دوره دبیرستان هم وجود دارد... واقعاً هزاران جلسه تشکیل داده اند که بدیهیاتی مانند خانواده بنیادی ترین واحد تشکیل دهنده جامعه است، انسان دارای اختیار است، جهان دارای نظام علّی - معلولی است، خداوند رحمان و رحیم است و ... را در سند بازنویسی کنند؟!
گلایه های جنجالی یک بازرگان با وزیر صنعت
گلایه های جنجالی یک بازرگان با وزیر صنعت - صحبتهای کنایه آمیز یک بازرگان با وزیر صنعت
ادامه داستان لُنگ و خانه سعدآباد
ادامه داستان لُنگ و خانه سعدآباد - ۱- خب چی میشه ولایتی بجای توصیه به لُنگ پوشی، بملت توصیه کنه تو سعدآباد مالک خونه بشن ویک سومشو وقف کنن؟ ۲- اینجور واینجا صاحبخونه شدن و بعد توجیه وقف، آدمو یادحافظ میندازه: فقیه مدرسه دی مست بود و فتوی داد که می‌حرام، ولی بِه زمالِ اوقاف است
عبدی : آقای ولایتی با خانه هزارمتری کنار کاخ سعدآباد حالا مردم رابه نان خشک خوردن دعوت می‌کنند
عبدی : آقای ولایتی با خانه هزارمتری کنار کاخ سعدآباد حالا مردم رابه نان خشک خوردن دعوت می‌کنند - حالا مردم رابه نان خشک خوردن دعوت می‌کنند؟مردم نیازی به این توصیه‌هاندارند اگرلازم باشد آن‌قدر شرف دارندکه از خودشان دفاع کنند ولی این دفاع،منحصربه دفاع دربرابر دشمنان خارجی نمی‌شود که باید وضعیت خیلی‌ها رادر داخل هم بررسی کرد.
فیلم | حمله به پلیس در اهواز به درگیری مرگ‌بار انجامید!
فیلم | حمله به پلیس در اهواز به درگیری مرگ‌بار انجامید! - فیلم - حمله فرد متهم در بازار پرنده فروشان اهواز به پلیس آگاهی منجر به درگیری مرگبار شد.
ماجرای عجیب منزل های مسکونی در همسایگی کاخ سعد آباد
ماجرای عجیب منزل های مسکونی در همسایگی کاخ سعد آباد - ماجرای عجیب دو منزل مسکونی در همسایگی کاخ سعدآباد و حسین فریدون و نهاد ریاست جمهوری
فیلم | لحظه حمله جن‌ها به یک مرد در کرج! (۱۶+)
فیلم | لحظه حمله جن‌ها به یک مرد در کرج! (۱۶+) - فیلم - به تازگی شخصی در فضای مجازی فیلمی منتشر کرده که مردی ادعا می کند در پارکینگ خانه اش مورد حمله جن ها قرار گرفته است.
فیلم | درس خجالت‌آوری که یک توریست به ایرانی‌ها می‌دهد!
فیلم | درس خجالت‌آوری که یک توریست به ایرانی‌ها می‌دهد! - فیلم - پاول یک توریست اهل چک است که با موتورسیکلتش دنیا را می گردد و یک هفته در ایران اقامت داشته است. ویدئوی سلفی که او در طبیعت ایران از خود و اقدام پسندیده اش منتشر کرده برای همه ایرانیان جای تامل دارد.
فیلم | جنازه غرق در خون ملکه زیبایی عراق (۱۶+)
فیلم | جنازه غرق در خون ملکه زیبایی عراق (۱۶+) - فیلم - قتل مدل و ملکه زیبایی عراق از روز گذشته سوژه رسانه ها شده و پلیس تحقیقات ویژه ای را برای دستگیر قاتل وی انجام داده است. تصاویر منتشر شده از جنازه غرق در خون وی را در ویدئوی زیر می بینید.
جنجال بنر سربازان اسرائیلی در شیراز
جنجال بنر سربازان اسرائیلی در شیراز - عکس این بنرکه گفته می‌شود نمایشگر تصویری از سربازان رژیم صهیونیستی است طی روزهای اخیر در فضای مجازی دست به دست می‌شد و واکنش‌هایی به همراه داشت.
عکسی آموزنده از سفر نیویورک
عکسی آموزنده از سفر نیویورک - پوشه‌های پُر از برنامه فرانسوی‌ها در برابر دستان خالی تیم ایرانی. به کاغذ ها و پرونده های موجود روبه روی تیم فرانسه دقت کنید!
ویدئوی جنجالی وزیر بهداشت؛ #خودت_بمال / تمسخر و تحقیر بیمار نیازمند توسط وزیر
ویدئوی جنجالی وزیر بهداشت؛ #خودت_بمال / تمسخر و تحقیر بیمار نیازمند توسط وزیر - وزیربهداشت بهترین توصیه رو به اون پیرمرد بیچاره کرد که گفت: خودت بمال. پیرمرد باید دستش رو محکم می‌مالید به گوش وزیر تا یک بار هم که شده از تخت اخلاق فرعونی بیاد پایین
نیاز شدید تلویزیون به بدحجابها در روزهای خاص
نیاز شدید تلویزیون به بدحجابها در روزهای خاص - کاش در این میان یکی به ما بگوید که بالاخره بی حجاب بد است، خوب است؟ چه زمانی بد است؟ چه زمانی خوب است؟
حال فعلی ! یا ناتوانی در تشخیص حال قبلی
حال فعلی ! یا ناتوانی در تشخیص حال قبلی - حمید رسایی عضو جبهه پایداری در صفحه شخصی خود در شبکه توییتر نسبت به اهانت زشت امیر تتلو به امام حسین (ع) و 72 تن از یاران باوفایش واکنش تندی نشان داد.
ویدئو/ وحشت پزشکان از تولد نوزاد تک چشم در اندونزی (۱۶+)
ویدئو/ وحشت پزشکان از تولد نوزاد تک چشم در اندونزی (۱۶+) - پزشکان هنگامی که یک نوزاد دختر اندونزیایی را در یکی از بیمارستان های این کشور به دنیا آوردند بسیار وحشت زده شدند. نوزاد تازه متولد شده با یک چشم بزرگ روی پیشانی اش متولد شد و پس از هفت ساعت درگذشت.
بازنشر نامه استاد به امیر تتلو! / معیار تشخیص حق از باطل گشته ای !
بازنشر نامه استاد به امیر تتلو! / معیار تشخیص حق از باطل گشته ای ! - فردی به نام علی‌اکبر رائفی‌پور كه رسانه‌‌های اصولگرا از او به عنوان «استاد، محقق و پژوهشگر» یاد می‌كنند! در تاریخ 29 اردیبهشت 96 (در كوران انتخابات ریاست‌جمهوری) در نامه‌ای سرگشاده به امیرحسین مقصودلو (تتلو) نوشت: «امیر جان بخوان، تو باید بخوانی، عیبی ندارد! سرت را بالا بگیر و خدا را شکر کن که به واسطه تو این همه نفاق را آشکار کرد! دلت محکم باشد پهلوان! تو فقط بخوان، بخوان
جنجال احمد خمینی در VIP عزاداری حسینی
جنجال احمد خمینی در VIP عزاداری حسینی - انتشار عکس‌های نشستن احمد خمینی زیر کولر در بخش وی‌آی‌پی هیات که پوششی شیشه‌ای دارد و از سینه‌زنان جداست، پس از توضیح او که گفت آن جایگاه مربوط به «روحانیون درجه یک و دو قم» است و «اون بالا معممین میشینن که لباسشون چون زیاده باعث گرمازدگی نشه»، با واکنش‌های تندتری هم همراه بود.