چهارشنبه ۲ اسفند ۱۳۹۶ / Wednesday, 21 February, 2018

کاستی های الگوریتمی در موتورهای جست و جوی وب


کاستی های الگوریتمی در موتورهای جست و جوی وب
● مقدمه
موتور جست و جوی وب ‎ از سه بخش تشکیل می شود :
۱) یک دنبالگرد crawler که صفحات وب را پیدا می کند تا داخل مجموعه صفحات وب آن موتور قرار گیرد،
۲) یک شاخص گذار indexer که شاخص معکوس inverted index ( نیز موسوم به شاخصindex ) را که ساختمان اصلی داده های مورد استفاده ی آن موتور جست وجو است و صفحات وب دنبال گشته crawled را ارائه می کند ،
۳) یک پاسخ دهنده که پرس و جو های کاربر را با استفاده از شاخصها پاسخ می دهد .
در حد مقصود ما بگوییم، دنبالگرد، وب را به مثابه ی یک گراف می نگرد : هر صفحه وب یک گره است و هر ابرپیوند یک کمان است .پرسش اساسی ای که دنبالگرد با آن رودررو است این است که کدام صفحه ها را پیدا کند تا ‹‹ مناسب ترین›› صفحات را در مجموعه ی خود داشت باشد .
برخی مسائلِ باز که ذیلاً عنوان شده است، می تواند دنبالگردها بهبود بخشد.
- درک بهتر از ساختار گراف (بخش ۳ ) ممکن است به راه کارآمدتری برای دنبالگردی در وب منجر شود .
- درک بهتر خصوصیت های مختلف وب (بخش ۲) می تواند مشخص کند کدام جمعیت از صفحه ها در دنبالگردی تا بدینجا کمترارائه شده هستند.
- راه مؤثری برای یافتن میزبانهای دوگان duplicate hosts می تواند به دنبالگرد کمک کند تا از دنبالگردی در دوگان‏‏‎ِ میزبانی که قبلاً دنبالگردی کرده است ، پرهیز نماید.
به فرض این که مجموعه ای از پرس وجوها به موتور جست و جو عرضه شده باشد ، مساله ی اصلی این است که کدام پرس وجوها بیشتر بوده است .البته برای کشف تأثیرات موقت ، جستن « تارک داران» top gainers و « تارک بازان» top losers نیز جالب است. این مسأله در بخش ۵ مطرح شده است.
در پایان ، دو مسأله را که در ارتباط با خوشه ای شدنِ موضوع-وابسته ی وب یا یک زیرگراف آن است مطرح می کنیم: بخش ۶ از مسأله ی یافتن زیر گرافهای دوبخشی جهت دار چگال بحث می کند. بخش ۷ پرسش چگونگی اشتقاق بردارهای ویژه ی ماتریسهای مختلف را از گراف وب عرضه می دارد. ما هر یک از این مسائلِ باز را ترسیم کرده ، ارجاعاتی نیز به کارهای پیشین در این زمینه می دهیم .
● نمونه گیری صفحات وب
درک وب و خصوصیت های آن ، از آغاز وب ، یک موضوع مهم تحقیقاتی است .چند صفحه در وب وجود دارد؟چند تا از آنها توسط موتور جست و جویی شاخص گذاری شده است؟ چند صفحه به یک زبان خاص یا در یک حوزه ی معین وجود دارد ؟ متوسط اندازه ی یک صفحه ی وب چقدر است ؟ چه درصدی از صحات وب صفحه ی اصلی هستند ؟ و این خصوصیت ها در زمان چگونه تغییر می کند ؟ موتور های جست وجو می کوشند تا آنجا که ممکن باشد، اطلاعات وب را ثبت کنند .به علاوه نسبت انواع مختلف صفحه ها ،‌نظیر صفحه های به زبانهای مختلف باید تقریباً متناسب با انواع موجود در وب باشد .
رد گیری این خصوصیات در دنبالگردی بدیهی است . بنابر این اگر این آمار برای وب معلوم باشد ، دنبالگرد می تواند تعیین کند که چه انواعی از صفحات وب تا بدینجا خیلی کمتر ارائه شده هستندو بکوشد بیشتر از آنها دنبالگردی کند.
برا ی نمونه گیری یکنواخت صفحات وب می شد از یک فن استفاده کرد ، تا همه ی چنین سؤالاتی را به جز سؤال نخست پاسخ داد . متأسفانه چنین فنی شناخته نشده است اگرچه تحقیقات دامنه داری در این خصوص صورت گرفته است .لارنس و جایلز[Lawrence and Giles ۹۹ ] از رهیافتهای مبتنی بر آزمون تصادفی نشانی های IP بهره گرفتند : آنها یک نشانی تصادفی IP را انتخاب کردند و بررسی کردند که آیا آن میزبان host یک وبگاه است یا نه . در صورت بودن ،آنها می کوشند صفحه های وب دسترس پذیر این وبگاه را نمونه گیری کنند . البته اگر از صفحات وب یک وبگاه فهرست جامعی نداشته باشیم این که چگونه از این صفحه های وب نمونه گیری کنیم ، همچنان یک مسأله ی باز باقی خواهد ماند. هنتسینگر و همکارانش [Henzinger et al. ۰۰] تشکیل یک راه تصادفی خاص را بر گراف (جهت دار ) وب و آنگاه نمونه گیری ازصفحات عبور شده را به طور معکوس متناسب با توزیع ثابت راه تصادفی مطرح نمودند.این رهیافت مشکلاتی چند دارد. یک مسأله این که، واضح نیست که چند مرحله باید انجام داد تا توزیع متوازن راتقریب زد. مسأله ی دیگر این که ، راه تصادفی خاصی را که ایشان مطرح می کننند، نمی توان مستقیماً پیاده سازی کرد ، بلکه این مسأله را می توان با استفاده از یک راه تصادفی دیگر غیر از آنچه ایشان در مقاله ی خود عرضه کرده اند حل کرد [Henzinger et al. ۰۰] .
بریوسف و همکارانش [Bar-yossef st al.۰۰]گراف وب را به یک گراف غیر جهت دار همبند و منظم تبدیل کردند. توازن یک راه تصادفی بر این گراف ، توزیع یکنواخت است . باز اینجا نیز واضح نیست که چند مرحله برای این راه لازم است .البته مسأله ی مهمتر این است که روش قابل اعتمادی برای تبدیل گراف وب به یک گراف غیر جهت دار در دست نیست . بریوسف و همکارانش درخواست یالهای داخلی یک صفحه معین را از موتورهای جست وجوی مختلف به منظور نمونه گیری همه ی یالهای مجاور یک صفحه ی معین مطرح نمودند. البته اغلب فقط یک زیر مجموعه از همه ی یالهای داخلی را بدین طریق می توان پیدا کرد .
عاقبت ، راسمه ویچین تونگ و همکاران [Rusmevichientong et al.] رهیافت هنتسینگر [Henzinger et al.] را اصلاح کردند تا روشی به دست آید که درآن تا حدی نمونه گیری یکنواخت حاصل شود.در عمل برآن باوریم که رهیافت ایشان خوب کار نمی کند،چرا که کثرتی از میزبانها در وب هستند که از درون این میزبان پیوند خورده اند ، اما اندکی از پیوندها این میزبان را رها می کنند.اگر راه تصادفی در [Rusmevichientong et al. ۰۱] به چنین میزبانی برخوردکند، شانس زیادی دارد که بخش عظیمی از گره ها از همین میزبان باشند، یعنی این که این نمونه نایکنواخت خواهد بود .
● مدل سازی گراف وب
به محض این که پژوهشگران وب مشاهده ی خصوصیت های گراف وب را آغاز کردند ، کوشیدند تا مدلی از گراف وب بسازند ( [Kleinberg et al. ۹۹] را بنگرید).به نظر می رسد راههای تصادفی بر گراف وب سریعاً همگرا شوند.به علاوه وقتی به پیوند های بین وبگاهها می نگریم ، این پیوندهاکاملاً تصادفی به نظر می رسد .بنا براین کوشش برای مدل سازی وب به عنوان گراف تصادفی مرحله ای بدیهی بوده است. این امر به مدل‏ِ گراف روگرفتِ copy graph کلاین برگ و همکاران [Kleinberg et al. ۹] و همه ی اصلاحیات آن منجر شد[Kumar et al. ۰۰, Pandurangan et al. ۰۲]
آن دسته از خصوصیات گراف وب که این مدلها می کوشند ثبت نمایند،توزیع درجه ی ورودی توانی است ، این واقعیت که عداد بزرگی از گروهک های کوچک و توزیع توانی صفحه-رتبه ای داریم .البته خاصیت خیلی مهمی از گراف وب هست که با هیچ یک از این گرافهای پیشین مدل نمی شود، یعنی این واقعیت که وب بیشتر یک ساختار دو سطحی است : هر صفحه ی وب متعلق به یک میزبان است و حدود ۷۵% این ابر پیوندها صفحه های همان یک میزبان را به هم پیوند می زنند[bharat et al. ۰۱] . یالهای بین گره های موجود در یک میزبان ساختار معتنابهی دارند : مثلاً هر صفحه روی یک میزبان می تواند به همان صورت انحصاری copyright form یا صفحه ی اصلی میزبان اشاره کند. حسب آخرین معلومات ، تا کنون مدلی ارائه نشده است که این ساختار دوسطحی را به اضافه ی سایر خصوصیات فهرست شده ی فوق ، مدل سازی کند. از این گذشته گراف میزبانی را که از طریق ادغام همه ی گره های آن میزبان به یک گره ایجاد شده است در نظر بگیرید . گراف حاصل نیز یک توزیع توانی ، با درجه ی ورودی و درجه ی خروجی دارد [Bhrat et al. ۰۱] . ضمناً هیچ مدل گراف تصادفی نیست که توزیع های توانی صفحات را و سطح میزبان را مدل سازی کند.
خلاصه اینکه ،‌مسأله ی باز ،‌ایجاد یک مدل گراف تصادفی است که رفتار گراف وب را بر صفحه ها و هم بر سطح میزبان مدل سازی کند.
● میزبانهای دوگان
موتورهای جست و جوی وب می کوشند تا از داشتن صفحه های دوگان و تقریباً دوگان در مجموعه خود پرهز نمایند، چراکه این صفحه ها زمانی را که می باید صرف افزودن محتوای مفید به آن مجموعه شود، می افزایند . به اضافه صفحه های دوگان و تقریباً دوگان در مجموعه ای ازصفحات دنبال گشته به خوبی مطالعه شده است [Brin et al. ۹۵ Broder ۹۷] . ضمناً تحقیقاتی نیز در زمینه ی تعیین فهرست های درختی دوگان موسوم به آینه ها mirrors صورت گرفته است [Bharat and Broder ۹,Cho et al. ۰۰] . در حالی که یافتنِ آینه mirror detection ‌ و یافتن تک صفحه individual-page detection می کوشند حل کاملی از مسأله ی صفحه های دوگان ارائه کنند ، یک گونه ی ساده تر می تواند در حین اینکه به منابع محاسباتی کمتری نیاز داشته باشد ، سود بیشتری حاصل کند. این مسأله ی ساده تر یافتن میزبان دوگان duplicate host detection نام دارد : یافتن دو میزبان که صفحه به صحه یکسان باشند . میزبانهای دوگان ( دومیزبانها duphosts ) بزرگترین منبع منفرد صفحه های دوگان بر روی وب هستند، پس حل مسأله ی میزبانهای دوگان به بهبود مهمی می رسد .
مسأله ی یافتن میزبانهای دوگان آسانتر از یافتن آینه است ، زیرا URL های بین دومیزبانها تنها در اجزاء نام میزبان تفاوت دارند.مضافاً ، صفحه های روی میزبانها دقیقاً یکسان هستند بدین معنی که این الگوریم نیاز به صورت بندی مجدد reformatting ندارد.بالاخره اینکه، مجموعه ی صفحه های روی میزبان نخست ، با مجموعه ی صفحه های روی میزبان دوم یکسان است . نخستین مجموعه ی رهیافتهای مسأله ی دومیزبانها توسط بهارا و همکارانش [Bharat et al. ۰۰] مورد مطالعه قرار گرفت ، اما میزان خطای الگوریتم آنها را احتمالاً می توان ( هم برا ی خطای اضافی و هم برای خطای نقصانی) کاهش داد .البته رهیافت کلی ایشان ارزشمند به نظر می رسد: هر میزبان را توسط یک ترسیم sketch ارائه کنید . مثلاً ترسیم می تواند درواقع زیر مجموعه ای از URL های روی میزبان یا ابر پیوندهای اشاره کننده به صفحه های روی میزبان باشد . آنگاه برای مقایسه ی میزبانها از این ترسیم بهره بگیرید . البته پرسشهای سخت چنین اند : چه ترسیمی را برگزینیم و چگونه از مقایسه ی همه ی جفت های میزبان دوری گزینیم؟ چون میلیونه میزبان متفاوت وجود دارند ، واضح است که مقایسه ی همه ی این جفت ها امکان پذیر نیست . ترسیمهای بهارات و همکارانش [Bharat et al.۰۰] صرفاً بر رشته ها ی URL ها و ساختمان ابر پیوند مبتنی است .
● جریانهای داده ها
ثبت پرس و جو های یک موتور جست وجو همه ی پرس وجوهای ارائه شده به آن موتور جست و جو را شامل است . جست و جوهای بسیاری به کندی در طی زمان تغییر می کنند . البته بیشترین افزایش یا کاهش جست و جوها از یک بازه ی زمانی تا بازه ی زمانی دیگر ، گرایش ها و سو گیری علایق کاربران را می نمایاند. ما اینها را تارک دار ها top gainers و تارک بازها top losers می نامیم . به دلیل اینکه تعداد پرس و جو ها بسیار زیاد است ، تارک دارها و تارک باز ها را باید با ایجاد یک گذر pass از ثبت های پرس و جو ها query logs محاسبه نمود .این امر به مسأله ی زیر در خصوص جریان داده ها منجر می شود : اگر دودنباله از اشیاء داده شده باشند ،‌آن اقلامی را بیابید که قدرمطلق آن وقتی که یک دنباله را با دیگری فقط در یک بار خواندن مقایسه می کنید، از بقیه بیشتر کاهش یا افزایش دارد . چاریکار و همکارانش [Charicar et al. ۰۲] یک الگوریتمِ ۲-گذر ۲-pass برای این مسأله ارائه داده ا ند. مسأله ی جالب دیگر این است که برای همه ی اقلام فوق یک بسامد frequency خاصی بیابیم که افزایش نسبی آن( یعنی :‌افزایش آنها بخش بر بسامد آنها در دنباله ی نخست ) بیشترین مقدار باشد.
● زیرگرافهای دوبخشی چگال
وب چنانکه کومار [Kumar et al.۹۹]نشان داده است ، بسیاری از زیرگرافهای دوبخشی جهت دار همبند چگال را شامل است ، چراکه اجتماعات سایبر cyber-communities اغلب چنین ساختار همبندی دارند.گره های مبدأ soure nodes در چنین زیرگرافی ،« هاب »ها hubs یا گره های هادی ِ directory nodes موضوع هستند .همچنین کومار و همکارانش الگوریتمی برای یافتن زیرگرافهای دوبخشی کامل کوچک که آن را هسته core نامید اند ، ارائه و پیاده سازی کرده اند . ایشان از یک رهیافت پایین به بالا (بالارو) استفاده کرده اند که از این واقعیت که هر هسته ی (i,i) ترکیبی از هسته های (i-۱,i-۱) است بهره می گیرد .البته هسته های ایشان نظر به دهها گره نسبتاً کوچک بودند.
به منظور ثب کامل این اجتماعات سایبر یافتن زیرگرافهای دوبخشی خیلی بزرگتر در میان صدها یا هزارها گره جالب خواهد بود. نیازی به تکمیل اینها نیست ،‌لکن باید چگال dence باشند، بدین معنی که باید دست کم بخش ثابتی از زیرگرافهای دوبخشی ِ کاملِ مرتبط را شامل شوند. آیا الگوریتمهای کارآمدی برای یافتن آنها وجود دارد ؟ و آیا این الگوریتمها را می توان به نحو کارآمدی پیاده سازی کرد اگر که فقط بخش کوچکی از این گراف در حافظه ی اصلی بگنجد؟
● افراز بردار ویژه ای ِ گرافهای جهت دار
داناث و هافمن [ Donath and Hoffman ۷۳] بهره گیری از بردارهای ویژه را به منظور افراز گراف غیر جهت دار به روشی متوازن balanced ارائه نمودند.از آن زمان کار زیادی در زمینه ی رهیافتهای طیفی spectral برای افراز گراف صورت گرفته است. برای ملاحظه ای عالی در این زمینه چونگ را بنگرید [chung] .شای و ملک [Shi and Malik ۰۰] نشان دادند که بردارهای ویژه ی ماتریسهای مختلفِ بنا شده بر ماتریس مجاورت ِ یک گراف ، به انواع مختلفی از برشهای متوازن در گراف مربوط است . فرض کنید W ماتریس مجاورت ِگرافِ غیر جهت دار ِ (V,E) با گره های ۱,۲,.. , n باشد و فرض کنید D یک ماتریس قطری باشد که برای آن di = deg(i) . فرض نمائید A و B مجموعه هایی از گره ها و E(A,B) مجموعه ی یالهای (a,b) باشد که .
▪ وابستگیِ متوسطِ average association یک مجموعه ی ِ A ، است.
▪ برش متوسط average cut یک مجموعه ی ِ A ، است.
▪ برش نرمال average cut یک مجموعه ی ِ A ، است.
شای و ملک نشان دادند که : دومین بردار ویژه ی بزرگ ِ W به مجموعه ای مربوط است که وابستگی متوسط average association را بیشینه می کند.دومین بردار ویژه ی کوچک W – D به مجموعه ای مربوط است که برش متوسط average cut را کمینه می کند، و دومین بردار ویژه ی کوچک مسأله ی تعمیم یافته ی بردار ویژه ، یعنی : تقریبی از کوچکترین برش نرمال به دست می دهد . این نتیجه ها برای گراف غیر جهت دار برقرارند ، اما گراف وب گرافی جهت دار است . بنابر این ، درک چگونگی ارتباط نتایج فوق برای گراف گرافهای جهت دار جالب خواهد بود . اینکه آیا بردارهای ویژه ی ماتریسهای نظیر از گرافهای جهت دار نیز با تجزیه های متوازن گراف جهت دار مرتبطند، ممکن است که این امر به یک زیرگراف خاص-موضوعِ topic-specific آن آن منجر شود. یکی از نخستین گامها را در این جهت گیبسُن و همکارانش [Gibson et al ۹۸] برداشتند.آنها از بردار ویژه ی ماتریس و ماتریس که A ماتریس مجاورت یک زیرگراف خاص-موضوع ِ آن است ،و برای تجزیه ی زیرگرافهای خاص-موضوع بهره گرفتند. ایشان حکایت گونه نشان دادند که بردار ویژه ی اصلی principal و چند بردار ویژه ی غیر اصلی فوقانی top ، گرافهای موضوعی را به چند اجتماعِ ابرپیوندشده hyperlinked communities یعنی خوشه های clusters صفحه های همان زیرموضوع subtopic تجزیه می کنند.

نویسنده : مونیکا آر. هنتسینگر

منبع : مرکز توسعه و تبادل دانش فناوری اطلاعات

مطالب مرتبط

تکامل وب و مقایسهء ابزارهای جستجو در اینترنت


تکامل وب و مقایسهء ابزارهای جستجو در اینترنت
كلمه اینترنت مخفف "Interconnected Networks" و به معنی شبكه‌های به‌هم‌مرتبط است. اینترنت سیستمی برای توزیع و تبادل اطلاعات در سطح جهان است كه براساس آخرین آمار موجود در حال حاضر ۲۲۶ كشور به آن متصل هستند. این مجموعه به همراه فناوری‌های ساده كاربردی، سبب كاهش هزینهء نشر الكترونیكی شده است (۱).در هر صورت، وب یك عنصر منسجم و واضح مستقل نیست، بلكه دو عنصر مجزای وب وجود دارند: وب قابل‌رویت و دیدنی، و وب نامرئی و غیرقابل رویت(۲).برای فهم كاربرد این دو عنصر و برای ارزیابی اطلاعات ضرورت دارد كه از موضوع خارج شویم و ببینیم چگونه صفحات وب تولید می‌شوند.دو نوع صفحهء وب وجود دارند: استاتیك و دینامیك.صفحات وب استاتیك توسط طراح وب، در خدمات‌دهندهء وب نصب می‌شوند و برای هر كس و هر چیزی كه وب سایت را مشاهده كند قابل دسترس‌اندو هر تغییری هم باید به صورت دستی انجام شود.صفحات وب دینامیك توسط رایانه با به‌كارگیری دستورهای یك زبان دستنوشته(۱) و اغلب «سی‌جی‌آی‌جاوا»(۲)كه به عنوان پلی بین سرویسگرهای پروتكل انتقال ابرمتن (۳) و كاربران وب عمل می‌كند، ایجاد می شود.دستورهای یك زبان دستنوشته، نتایج را در یك صفحهء خالی وب جا می‌دهند و به كاربر، صفحهء وب دینامیك را ارائه می‌دهند. صفحات وب استاتیك اطلاعات عام و كلی را برای كاربر تهیه می‌كند، در حالی كه صفحات وب دینامیك، اطلاعات منحصربه‌فرد را برای كاربر تهیه می‌نمایند. صفحات وب استاتیك برای همهء كاربران قابل رویت‌اند و در دسترس می باشند.اولین مطالعه در موسسه تحقیقاتی «ان‌ئی‌‌سی» در پرینستون آمریكا در دسامبر سال ۱۹۹۷ نشان داد كه صفحات وب قابل رویت، حداقل ۳۲۰ میلیون صفحهء وب را شامل می‌شوند، در حالی كه دومین مطالعه تخمین زد كه تعداد صفحات وب رشد كرده و به ۸۰۰ میلیون صفحه در فوریه سال ۱۹۹۹ رسیده‌اند. در هر صورت، اكثر ناشرین اطلاعاتشان را بر روی وب به وسیلهء پایگاه‌های اطلاعاتی بزرگ توزیع می‌كنند. این اطلاعات اساسا جنبه تجاری دارد (۲).
موتورهای جستجوگر(۴) و راهنماهای وب
۲. ۱. راهنماهای وب
چه تفاوتی بین راهنمای وب و موتور جستجو وجود دارد؟
راهنمای وب:
الف. فهرستی از سایت‌های وب كه از قبل تعیین شده‌اند، می‌باشد؛
ب. توسط ویراستاران جمع‌آوری شده؛
ج. براساس موضوع و عنوان طبقه بندی شده؛
د. انتخابی است.
با توجه به این كه راهنماهای وب توسط افراد جمع‌آوری می‌شوند, تصمیم‌گیری دربارهء كیفیت محتوای هر یك از سایت‌های وب قبلا انجام شده است. در نتیجه راهنماهای وب در اینترنت بسیار مورد مراجعه قرار می‌گیرند، زیرا كاربران به دنبال موضوعات خاصی در اینترنت هستند كه این راهنماها، نقطهء شروع خوبی در تشخیص بهترین‌ها در وب می‌باشند.در كاربرد راهنماهای وب، كاربر می‌تواند در بین فهرست‌‌های راهنما حركت نماید. راهنماهای اصلی وب همچنین اجازهء عبور از دیگر موتورهای جستجو را هم می‌دهند. مثلا بزرگ‌ترین راهنمای وب، یعنی «یاهو»، اجازهء عبور از موتور های جستجوی دیگر را می‌دهد.
سایت‌‌های وبی كه به وسیلهء راهنمای وب نمایه‌‌سازی شده‌اند، به علت روند تكمیل به صورت دستی، در آن راهنماها باقی می‌مانند؛ مگر این كه به احتمال بسیار ضعیف به صورت دستی حذف شوند. در حالی كه وجود دائمی یك لیست یا یك فهرست در موتور جستجو همیشه ضمانت نمی‌شود، اما ساختن و حضور دائمی یك فهرست در یك راهنمای وب مثل «یاهو» امكانپذیر می‌باشد.
۲ . ۲ .۱. اسپایدرهای موتورهای جستجوگر
پایگاه اطلاعاتی موتورهای جستجوگر ابتدا توسط «اسپایدرها» ساخته می‌شود و توسط موتورهای جستجوگر به مأخذ اصلی اعزام می‌شود.«اسپایدرها» برنامه‌هایی هستند كه وب را به دنبال صفحات جدید وب جستجو می‌نمایند، كلمات را نمایه‌سازی می‌كنند و اتصال را به صفحات برقرار می‌نمایند، سپس كلمات نمایه‌شده را با آد‌رسی كه به یك صفحهء وب یا هر منبعی كه بر روی وب جهانی و به طور كلی اینترنت قرار دارد اشاره می‌نماید,(۶) مقابله می‌كنند.
۲. ۲ .۲. نمایهء پایگاه اطلاعاتی موتور جستجو
این بخش عنصر اصلی از هر موتور جستجو است. این همان چیزی است كه كاربر به دنبال آن است. در طی سال ۱۹۹۸ تعدادی از تولید‌كنندگان موتورهای جستجو آغاز به كار كردند. این شركت‌ها نمایه‌ها را مطابق با معیارهای گوناگون ساختند. بطور مثال می توان از نمایهء «دایركت هیل» و «گوگل» (۷) نام برد و نیز «نمایهء ‌نام‌های حقیقی» (۸) كه شركت‌ها را قادر می‌سازد واژه‌های كلیدی خود را برای حمایت از محصولات خود ثبت نمایند.
۲ . ۲ . ۳ . نرم‌افزار بازیابی اطلاعات
تمامی موتورهای جستجوگر، نرم‌افزار مختص به خود برای پاسخگویی به سوالات دارند.موتورهای جستجوگر مطابق با قوانین مشابه به شرح زیر عمل می‌نمایند: هر سایت وب شامل كلمات یا واژه‌هایی است كه سوءال كاربر را با آن‌ها مقابله می‌كند. و در صفحهء نمایش، به صورت فهرست‌وار نمایش می‌دهد و با توجه به سوال كاربر و ارتباط موضوعی، فهرستی از مطالب را طبقه‌بندی می‌نماید. تفاوت مختصری در چگونگی كار الگوریتم‌ها بین موتورهای جستجو وجود دارد، كه دلیلی بر این مدعااست كه كاربران، با یك پرسش واحد, از موتورهای مختلف نتایج متفاوتی را كسب می‌نمایند. در هر صورت، دلیل مهم دیگر اختلاف نتایج جستجو، نسبت پایین همپوشانی، در بین موتورهای جستجو‌گر می‌باشد.
۳ . پورتال‌ها
«پورتال»(۹) ها سایت‌های وبی هستند كه خود عرضه‌كنندهء خدمت خاصی نیستند، ولی مراجعین را به صورت ساده و دوستانه به اطلاعات و سایت‌های موردعلاقه‌شان هدایت می‌كنند. «پورتال» ها نقاط اصلی برای راهبردهای تجارت الكترونیكی هستند و به تدریج از سال ۱۹۹۴ به وسیلهء سه نوع شركت اینترنتی به وجود آمدند. این شركت‌ها كه نقش اساسی در توزیع زنجیرهء اطلاعاتی برای كاربر ایفا می‌كنند به شرح زیر می‌باشند:
الف. تولیدكنندگان خدمات اینترنتی(۱۰)
ب. سایت‌های جستجو(۱۱)
ج. تولیدكنندگان مرورگر(۱۲)
سایت «اكسایت»(۱۳) نمونه‌ای كه از یك سایت پورتال موفق است(۱).
۴. توسعه و تكامل فناوری جستجو
همهء ما تكامل زندگی بشر بر روی كره خاكی را به خاطر داریم. همانطور كه همگی ما می‌دانیم، شكل‌های مختلف زندگی سلولی برای مدت‌های بسیار طولانی قبل از تكامل زیستی وجود داشته است. در هر صورت هنگامی كه به این نقطه از تكامل دست یافتیم، تغییرات به فرم سازمان‌یافتهء آن در مدت زمان كم‌تری به انجام رسید.همین مطلب برای فناوری جستجوی وب نیز صادق است. با تاكید بر روی پور‌تالیزیشن و تجارت الكترونیكی، اولین نسل سایت‌های جستجو، عملاً و به تدریج فراموش شدند و این در حالی است كه آن‌‌ها تا سال‌‌های متمادی، حكومت اصلی را به عهده داشتند؛ اما بدلیل این كه نتوانستند خودشان را با تغییرات محیطی وفق بدهند، فراموش گردیدند و انواع جدیدی از تولیدكنندگان جستجو به بهره‌برداری رسیدند.۴ .۱. موتورهای جستجوی ماورا
موتورهای جستجوی ماورا(۱۴) به كاربر این امكان را می‌دهند كه از میان موتورهای جستجوی متعدد و راهنماهای وب به طور مقارن و همزمان، جستجو نماید (۲و۳).
محبوب‌ترین موتورهای جستجوی ماورا به شرح زیر می‌باشند:
- Dogpile ( www.dogpile.com )
- Mamma ( www.mamma.com )
- ۲Q ( www.۲q.com )
- Infind ( www.infind.com )
- Insleuth ( www.isleuth.com )
- Surfy ( www.surfy.com )
- Webtaxi ( www.webtaxi.com )
۴ .۲. نسل اول موتورهای جستجو كه توسط سایت‌های وب بصورت«اسپایدر», نمایه‌سازی را ایجاد كردند، انبوهی از واژه‌ها و كلمات را تجزیه و تحلیل نمودند. راهنماهای وب به طور دستی گردآوری شدند و از آوریل ۱۹۹۸ مورد بهره‌برداری قرار گرفتند: یكی از این راهنماها به نام «دایركت هیل»(۱۵)یك حركت ریشه ای را آغاز كرد و اصلاحاتی انجام داد و روش خود را «راه سوم»(۱۶) نامید.این راهنمای وب ادعا می‌‌كرد كه در زمان جستجو، كنترل با كاربر است و نتایج به صورت طبقه‌بندی شده بر روی سایت وب نمایان می‌شوند. این موتور جستجو، آنچنان كه ادعا می‌كرد نتوانست خدمات منحصربه‌فردی را ارائه نماید. بنابراین موتور جستجوی دیگری به نام «هاتبات»(۱۷)به جای آن تولید شد (۲).
۴ .۳. جستجوی زبان طبیعی
همانطور كه قبلا بحث شد، اولین نسل موتورهای جستجو با مقابلهء واژه‌هایی كه توسط كاربران ارائه می‌شدند عمل می‌نمودند. آن‌ها به محتوای واژه‌های جستجو توجه نمی كردند. برای مثال به ارتباط منطقی بین واژه‌های جستجو و دیگر معناهای لغوی توجه نمی‌شد، به علاوه، لغات را به صورت تحت‌اللفظی جستجو می‌كردند و به واژه‌ها و توصیفگر‌های‌بولی‌ نظیر and, or, not توجه‌ نداشتند. دو موتور جستجوی جدید یكی پس از دیگری در طول یك هفته آغاز به كار كردند. این موتورهای جستجو، به شرح زیر زبان طبیعی را برای جستجو پیشنهاد كردند:
الف.Ask Jeeves www.askjeeves.com
این موتور جستجو در اول ژوئن سال ۱۹۹۸ شروع به كار كرد و به عنوان اولین موتور جستجوی زبان طبیعی بر روی اینترنت معرفی شد. این موتور جستجو سوءال كاربر را با استفاده از پایگاه اطلاعات هفت میلیونی سوءالات، پاسخ می‌داد. اگر هیچ گونه مقایسه‌ای وجود نداشت، سپس نزدیك‌ترین واژه از پایگاه برای كاربر ارائه می‌شد و سوءال می‌شد كه مناسب‌ترین آن را انتخاب كند. این موتور جستجو همچنین كاربر را به موتورهای جستجوی دیگری نیز راهنمایی می‌كند، مانند «یاهو»، «لیكاس», «اینفوسیك» و «آلتاویستا».
ب. دومین موتور جستجو به نام Electric Monk چند هفته بعد آغاز به كاركرد. این موتور جستجو با استفاده از زبان طبیعی، الگوریتم سوءالات كاربران را پاسخ می‌گوید. این الگوریتم با استفاده از اصطلاحنامه، به واژه‌های مرتبط نیز توجه می‌كند. جستجو از طریق زبان طبیعی در این موتور جستجوگر، سپس به صورت سوءالات مركّب بولی درآمد و به «آلتاویستا» تسلیم شد.
۴ .۴. تجزیه و تحلیل متكی بر اتصال
موتورهای جستجوی نسل اول برای ساخت نمایه‌های عظیم با هدف پاسخگویی به هر نوع سوال ساخته شدند. آن‌ها به محتوای هر صفحهء خاص تأكید داشتند كه چگونه این صفحات به هم مربوط می‌شوند و اتصال می‌یابند. همانطور كه قبلا گفته شد، روش نمایه‌سازی آن‌ها به دلیل بی‌توجهی به تركیب زبان، ساخت جملات و مترادف‌ها با شكست روبرو شد.تجزیه و تحلیل متكی بر اتصال سعی دارد كه با بررسی ارتباط بین صفحات، بر این مشكلات فائق آید. موتورهای جستجوگر متكی بر اتصال به سرعت رشدكرده‌اند و از نظر كاربران اینترنت در حال حاضر از محبوبیت خاصی برخوردارند.
۴.۴.۱.«گوگل»(۱۸)
این موتور جستجوگر نیز مانند «یاهو» توسط دانشجویان دانشگاه استانفورد ایجاد شد این فناوری با استفاده از روشی با نام «رتبه‌بندی صفحه»(۱۹) وب، به دیگر موتورهای جستجو متصل می‌شود. اگر شما، به عنوان یك نویسندهء سایت وب، به دیگر سایت‌های وب از جهت اهمیت آن سایت‌ها متصل شوید، می توانید داوری‌ها و پیشنهادهایی دربارهء سایت ارائه دهید. همانطور كه راهنماهای وب نظیر «یاهو» توسط ویراستاران به صورت دستی جمع‌آوری و تالیف گردیده‌اند. «گوگل» هم به دنبال اعلام قضاوت میلیون‌ها نویسندهء سایت وب به صورت خودكار طراحی شد.البته این موتور جستجو در مقایسه با «یاهو» با سایت‌های وب بیش‌تری دسترسی دارد. در حقیقت برخلاف دیگر موتورهای جستجوگر، كه هر چه نمایه‌های آن‌ها گسترده‌تر می‌شود، كم‌تر مفید واقع می‌شوند، «گوگل» ادعا دارد كه با گستردگی نمایه‌ها و عظیم‌تر شدن آن‌ها، به نتایج بهتری دست یافته است. از دیگر موتورهای جستجو كه با استفاده از الگوریتم طبقه‌بندی عمل می‌نمایند می‌توان از«هاتبات» و «اكسایت» نام برد. «گوگل» تنها موتور جستجویی است كه به طور بسیار گسترده ای جستجو‌هایش متكی بر اتصال می‌باشند. تخمین زده شده كه نمایهء این موتور جستجو‌گر بین ۷۰ تا ۱۰۰ میلیون صفحه می‌باشد، اما از طریق اتصال، قدرت دسترسی به بیش از ۳۰۰ میلیون صفحهء وب نیز به كاربر اینترنت داده می‌شود. دسترسی بیش‌تر و صحت نتایج جستجوی بیش‌تر سبب گردیده كه این موتور جستجو در ردیف ده موتور جستجوی محبوب در شبكهء اینترنت قرار گیرد.
۴.۴.۲. (۲۰)Clever
با توجه به «نمایه‌نامهء استنادی علوم»(۲۱) (مطالعهء ارجاعی مقالات علمی با یكدیگر) clever جستجوی واژه‌های كلیدی را براساس تلفیق كلمات و ارتباط مطالب بررسی می‌نماید. این موتور جستجوگر نیز مانند «گوگل» با استفاده از اتصال، به سوءالات پاسخ می‌دهد. ولی برخلاف «گوگل» ابتدا سوءال را به دیگر موتور‌های جستجو نظیر «آلتاویستا» تسلیم می‌كند و سپس كاربر را به صفحاتی كه از نتایج جستجو كسب شده‌اند راهنمایی می‌نماید. این موتور جستجو توسط شركت «آی‌بی‌ام» ایجاد شده.۴.۴.۳. Focused Crawler
یكی دیگر از موتورهای جستجویی كه توسط شركت،« آی‌بی‌ام» ایجاد شده. این موتور جستجو البته به اندازهء clever گسترش پیدا نكرد. برخلاف دیگر موتورهای جستجو نظیر «گوگل» و clever، این موتور جستجو مجموعه‌ای بسیار مناسب و در ارتباط با موضوع را از طریق وب جستجو می‌نماید. به زبانی دیگر، این موتور جستجو فقط سایت‌های وبی را جستجو می‌كند كه در ارتباط با پرسش كاربر می‌باشند.
جستجوی گروه‌های خبری
در حالی كه در حال حاضر وب به مثابه مخزن اولیهء دانش بشری بر روی اینترنت می‌باشد، تنها مخزن هم به حساب نمی‌آید. گروه‌های خبری، محلی است كه گروهی از افراد، تجربیات، افكار و دانش خود را در مورد یك موضوع مورد علاقه، برای بازیابی اطلاعات به اشتراك می‌گذارند. تفاوت بین وب و گروه‌های خبری در این است كه وب مجموعه‌ای از دانش بشری را به طور صریح و روشن ارائه می‌كند. در حالی كه گروه‌های خبری مجموعه‌ای از دانش بشری را به طور ضمنی و غیرصریح ارائه می‌نمایند.دانش صریح و روشن می‌تواند به افراد و موءسسات كمك كند تا از اطلاعات و تجارب گذشته برای برنامه‌ریزی آینده كمك بگیرند، اما دانش غیرصریح و ضمنی مجموعه‌ای از تجارب و عقاید و خلاقیت‌هایی است كه برای استخراج اطلاعات صریح و روشن مورد نیاز می‌باشد.
۴.۴.۴. اطلاعات شركت‌ها
سایت‌های زیادی دربارهء معرفی شركت‌ها و تولید‌كنندگان اطلاعات تجاری وجود دارند. هر محققی می‌تواند از این سایت‌ها بازدید كند. چنین سایت‌هایی دارای پایگاه‌های تجاری می‌باشند. یك برر‌سی بر روی نام‌های شركت‌ها براساس عملكرد موتورهای جستجوگر پیشرو و راهنماهای وب برای انتقال نتایج مناسب برای پژوهشگران‌نشان‌داد‌كه «سراچ انجین واچ»(۲۲)و«هاتبات‌» و «گوگل» در رده‌بندی، در رده‌های ابتدایی قرار می‌گیرند.در آگوست ۱۹۹۹، موتور جستجو‌گر «جامپ»(۲۳) آغاز به كار نمود. این موتور جستجوگر دارای یك نمایهء تخصصی است كه بر اطلاعات و خبرهای مربوط به شركت‌ها تأكید دارد. این موتور جستجو‌گر فهرستی از شركت‌ها، شامل اطلاعاتی نظیر عناوین شركت‌ها، قدمت، زمینهء موضوعی و آدرس پست الكترونیكی و ثبت اختراعات، و شركت‌های وابسته به آن شركت را نیز معرفی می‌نماید (۲و۳).
۴.۴.۵. فایل‌های تصویری و چند‌رسانه ای
تقریباً ۷۰ درصد از صفحات وب غیرمتنی هستند. آنچه مسلم است كاربرد, مفاهیم را به همراه تصاویر بهتر از اطلاعات فقط به صورت متنی درك می‌نماید. سه موتور جستجوی تخصصی اصلی كه فایل‌های تصویری و چند‌رسانه‌ای را ارائه می‌دهند، در این زمینه به شرح زیر می‌باشند.
Ditto ( www.ditto.com )
Scour ( www.scour.net )
Altavista photo finder( www.altavista.com )
مقایسهء ابزارهای جستجو در اینترنت
این روزها اینترنت منبع اصلی تهیهء منابع اطلاعاتی شناخته شده است. ابزارهای مهمی برای كمك به یافتن اطلاعات در این فضای اطلاعاتی وجود دارند. راهنماها و موتورهای جستجوگر پایگاه‌های اطلاعاتی هستند كه به روند دریافت اطلاعات سرعت می‌بخشند. این ابزارها اسناد را با استفاده از زبان علامتگذاری ابرمتن(۲۴) جمع‌آوری، ذخیره و تنظیم می‌نمایند. قبل از ظهور اینترنت اكثر پایگاه‌های اطلاعاتی كتابشناختی نقش اصلی را در بازیابی اطلاعات ایفا می‌‌كردند. با توسعهء نرم‌افزارهای جستجو، اطلاعات علمی به راحتی قابل دستیابی شدند. تعداد ابزارهای جستجو در اینترنت به طور مداوم در حال رشد است. در این مقاله تعداد ده ابزار جستجو در اینترنت از قبیل راهنماها و موتور‌های جستجوگر براساس تعداد صفحات اتصال، انتخاب شده‌اند.نتایج ارزیابی ابزارهای جستجوی اینترنت با توجه به معیارهای اصلی بازیابی اطلاعات در جدول یك نشان داده شده است. شش معیار برای ارزیابی وجود دارد و حداكثر نمره ۶ می‌باشد.تقریبا همهء ابزارهای جستجو چهار معیار اصلی را دارند. غیر از Nerdworld كه از شش عملگر منطقی بولی فقط از OR استفاده می نماید,و «یاهو» كه عملگر پرانتز را قبول نمی كند, اختلافات دیگری نیز وجود دارند. «اینفوسیك» از عملكرد ستاره (*) استفاده نمی‌كند و «لیكاس» و «وب كراولر» سیستم را ملزم می‌كنند كه ستاره را به عنوان اولین حروف كلمات در جستجو استفاده نماید.تنها ابزارهای جستجوی اینترنت كه جستجوی كاملی را ارائه می دهند «لیكاس» و «اینفوسیك» هستند. با توجه به جستجو براساس طبقه‌بندی موضوعی، فقط دو راهنما یا دایركتوری «یاهو» و Nedworld همهء صفحاتشان طبقه‌بندی و دسته‌بندی شده است. و Northen light تنها موتور جستجوگر می‌باشد كه اجازهء جستجو براساس طبقه‌بندی را نمی دهد (۲). در «نورثرن لایت» این امكان وجود دارد كه به وسیلهء نواحی (۲۵)، جستجو انجام شود. در دیگر موتورهای جستجو‌گر این امكان كم‌تر وجود دارد. با توجه به جدول شماره ۳، «نورثرن لایت» از تعداد ۹ ناحیه شش ناحیه شامل: عنوان, نشانی، «یوآراِل», كشور، زبان، تاریخ، و نوع سازمان را جستجو می‌نماید.و بالاخره سه ابزار جستجوی باقی‌مانده یعنیWeb Crawler, Nerdworld and Aolnet findامكان جستجو از طریق نواحی را ارائه نمی‌دهند.در اینجا باید توجه كرد مهم‌ترین نواحی مورد توجه در ارتباط با جستجو، عنوان، «نشانی» یوآراِل, و زبان می‌باشند.هیچ اختلافی در میان موتورهای جستجوگر و راهنماها در مورد استفاده از ناحیه وجود ندارد. از تعداد دو راهنما در این مقاله، «یاهو» پنج ناحیهء قابل جستجو را پیشنهاد می‌كند و «نِرد وُرلد» هیچ ناحیه‌ای را پیشنهاد نمی‌نماید. ضمنا دیگر موتورهای جستجوگر نیز در مورد استفاده از نواحی ناهمگون هستند.با توجه به قابلیت مرور(۲۶) و نظراندازی، موتورهای جستجوگر به شرح زیر امكان مرور و نظراندازی را ارائه می‌دهند.«اكسایت»، «لیكاس»، «آلتاویستا», «هاتبات»، «نورثرن لایت». به موتورهای‌جستجوگر نظیر «نورترون لایت» و «آلتاویستا» امكان استفاده از ناحیهء كشوری را ارائه می‌دهند.سه‌ابزار جستجو‌كه‌قادرند دستورها(۲۷) را‌به كار‌ببرند شامل «آلتاویستا», «هاتبات» و «اینفوسیك» می‌باشند. این سه موتور جستجوگر پس از جستجوی یك‌كلمه‌ای، فهرستی از واژه‌های تركیبی را برای راهنمایی‌های بعدی و گسترش ارائه می‌دهند.
درجه‌بندی موتورهای جستجوگر
نتیجه‌گیری
مهم‌‌ترین نتیجهء قابل توجه این است كه هیچ ارتباطی بین محبوبیت و قابلیت جستجوی اطلاعات در میان ابزارهای جستجوی مورد مطالعه وجود ندارد. دو مثال واضح از این یافته‌ها «نورثرن لایت» و «یاهو» می‌باشند. اگر چه «نورثرن لایت» كم‌ترین شهرت و محبوبیت را در رده‌‌بندی از نظر اتصال دارا می‌باشد، این موتور جستجوگر اولین مقام را در رده‌بندی از نظر امكانات و قابلیت‌های بازیابی اطلاعات كسب نموده است. در حالی كه «یاهو» یكی از محبوب‌ترین ابزارهای جستجو می‌باشد، ولی از نظر بازیابی اطلاعات، در ردهء پایینی قرار دارد.این بررسی تفاوت عمده‌ای را بین موتورهای جستجوگر یا راهنماهای وب نشان نداد. در جمع‌آوری اطلاعات و تجزیه و تحلیل اسناد، راهنماها قابل اعتمادترند، زیرا سیستم‌های دستی استفاده می‌كنند. موتورهای‌جستجوگر نیز به دلیل‌استفاده از دستورهای(۲۸) زبان علامتگذاری فوق‌متن یا ابرمتن‌ها(۲۹) اهمیت دارند. هرچند روشن نیست كه نتایج قابل‌توجهی را ارائه دهند.اگرچه‌راهنماها‌و‌موتورهای‌جستجوگر پایگاه‌هایی هستند كه صفحات زبان علامتگذاری فوق‌متن را فهرست می‌كنند، از نقطه نظر بازیابی اطلاعات، با توجه به دلایل زیر نسبت به پایگاه‌های اطلاعاتی كتابشناسی معمولی دارای امكانات كم‌تری هستند.
- تعدادی از ابزارهای جستجو تمامی امكانات موجود در پایگاه‌های‌ اطلاعاتی كتابشناختی معمولی را ندارند.
- محدود نمودن بازیابی به وسیله نواحی، چندان در ابزارهای جستجو در اینترنت رایج نیست.
- محققین سوءالاتی دربارهء نواحی عنوان نشانی كه به یك صفحهء وب، یا هر منبعی بر روی وب جهانی و به طور كلی اینترنت اشاره می‌كند دارند، كه تنها در نیمی از ابزارهای جستجو در اینترنت یافت می‌شوند. نه راهنماها كه اطلاعات را از طریق پرسشنامه‌های واگذار شده كسب می‌نمایند و نه موتورهای جستجوگر كه از صفحات زبان علامتگذاری فوق‌متن استفاده می‌كنند، در جستجوهایشان از نواحی استفاده نمی‌كنند.
- مرور نمایه‌نامه‌ها یك شكل معمول و رایج نیست.
- استفاده از معانی لغات كنترل شده در ابزارهای جستجوی اینترنت كاربردی ندارد (۲و۳).
پی‌نوشت‌ها
۱-Script
۲-Java common Gateway Interface (Jave Cgi)
۳-Search Engines
۴-Script
۵-Spiders
۶-URL (Uniform Resource Locator)
۷-Direct hill
۸-Google Real Names Index
۹-Portal
۱۰-Intetnet Service/Access Providers
۱۱-Search Sites
۱۲-Browser Providers Ultra Search Engines
۱۳-www.excite.com
۱۴-Ultra Search Engines
۱۵-www.directhil.com
۱۶-The Third way
۱۷-Hotbot
۱۸-www.google.com
۱۹-Page Rank
۲۰-www.almaden.ibm/cs/k۵۳/clever.htm/
۲۱-Science Citation Index
۲۲-Search Engine Watch
۲۳-Jump
۲۴-Hrml (Hypet text Mark up language)
۲۵-Fields
۲۶-Browsing
۲۷-Meta tags
۲۸-Meta Tags
۲۹-hyprtext Mark up Language

تالیف: جیران خوانساری
كارشناس ارشد كتابداری و اطلاع‌رسانی-مركز اطلاع‌رسانی كتابخانه توانیر


وبگردی
سیف و بازی تکراری غیر مجازها !
سیف و بازی تکراری غیر مجازها ! - حرفهای تکرای بانک مرکزی در مورد صرافی ها و موسسات مالی غیر مجاز با یک جستجوی ساده در اینترنت.
مصاحبه دختری که با ریش به «آزادی» رفت با یورونیوز
مصاحبه دختری که با ریش به «آزادی» رفت با یورونیوز - فیلم - زهرا خوش نواز در گفتوگو با یورونیوز از مراحلی که برای آماده سازی ظاهرش طی کرد تا با چهره‌ای متفاوت وارد استادیوم شود گفت. او می‌گوید: «زمانی که از تونل گذر کردم و وارد ورزشگاه شدم و چشمانم به چمن ورزشگاه افتاد گریه‌ام گرفت.»
بار دیگر زیر گرفتن ماموران پلیس با ماشین سواری توسط دراویش
بار دیگر زیر گرفتن ماموران پلیس با ماشین سواری توسط دراویش - باز هم زیر گرفتن ماموران امنیتی و نیروی انتظامی توسط یک ماشین دیگر سواری توسط اراذل خیابان گلستان هفتم
حمله با اتوبوس به مأموران پلیس در پاسداران
حمله با اتوبوس به مأموران پلیس در پاسداران - کی از دراویش گنابادی با اتوبوس به مردم و مأموران پلیس در خیابان پاسداران تهران / گفته میشود تعداد شهدای ناجا در حمله آشوبگران فرقه ضاله گنابادی و حامیان نورعلی تابنده به ۴ تن رسیده است.
لحظه مواجهه وزیر راه با خانواده قربانیان سانحه هواپیمای
لحظه مواجهه وزیر راه با خانواده قربانیان سانحه هواپیمای - به دنبال سقوط هواپیمای تهران-یاسوج ویدیو لحظه مواجه خانواده های جانباختگان را با وزیر مشاهده می کنید.
حمله با چاقو به یک راننده سر پارک خودرو
حمله با چاقو به یک راننده سر پارک خودرو - تصاویری دردناک از حمله مرد موتور سوار با چاقو به یک مرد راننده در حضور همسر و فرزندش در شهرستان داراب استان فارس را در ویدئوی زیر می بینید. به نظر میرسد این اتفاق در پی جرو بحثی بر سر پارک کردن وسایل نقلیه روی داده است!
اگر «عدم رویارویی با حریفان اسرائیلی» آرمان ماست چرا پنهانی و دزدکی؟
اگر «عدم رویارویی با حریفان اسرائیلی» آرمان ماست چرا پنهانی و دزدکی؟ - آنچه مشخص است جمهوری اسلامی ایران باید تصمیم مشخص و درستی درباره سیاست عدم رویارویی با ورزشکاران رژیم صهیونیستی بگیرد. دیگر نمی‌توان با این روش تعقیب و گریزی با این مسئله برخورد کرد. دیگر نمی‌توان ورزشکاران را از مقابله با کشتی‌گیران اسرائیلی باز داشت و در برابر رسانه‌های جهانی گفت به خاطر مصدومیت در میدان حاضر نمی‌شویم و در داخل جشن بگیریم که ما عزت‌مان را حفظ کردیم و...
بدل ایرانی آنجلینا جولی رونمایی شد !
بدل ایرانی آنجلینا جولی رونمایی شد ! - شب گذشته مراسم اکران فیلم بلوک 9 خروجی 2 به کارگردانی علیرضا امینی و تهیه کنندگی محمدرضا شریفی نیا و نیز فیلم شاخ کرگدن در پردیس سینمایی ملت برگزار گردید.
اظهارات جنجالی احمدی نژاد در مقابل دادگاه
اظهارات جنجالی احمدی نژاد در مقابل دادگاه - سخنرانی پرحاشیه احمدی نژاد در مقابل دادگاه بقایی
    طرز تهیه فیله مرغ نودلی
    فیله مرغ نودلی و طرز تهیه فیله مرغ نودلی و طرز تهیه انواع غذاهای ایرانی و خارجی را در آشپزخانه نمناک مشاهده نمائید.