جمعه ۲۹ تیر ۱۳۹۷ / Friday, 20 July, 2018

عنوان بهتر، محتوای بهتر، رتبه بالاتر


عنوان بهتر، محتوای بهتر، رتبه بالاتر
موتورهای جستجو (Search Engines) را می‌توان فرمانروایان بی‌چون و چرای اینترنت دانست. در اصل حیات و بقای وب‌سایت‌ها در گروی اقدامات موتورهای جستجوست و این كه تا چه اندازه پذیرای آن‌ها باشند و در كجای لیست عریض و طویل وب‌سایت‌هایشان جا دهند. این مطلب و نگرانی مهم است كه همه كارها و استراتژی‌ یك صاحب وب‌سایت را جهت می‌دهد. رضایت "عنكبوت‌های موتورهای جستجو" موضوعی است كه ذهن این افراد را درگیر كرده سعی می‌كنند مطالب و محتوای وب‌سایتشان را مطابق معیارها و استانداردهای این عنكبوت‌ها تدوین نمایند. شاید عبارت Search engine Spiders را نشنیده باشید و معنایش را ندانید. برایتان شرح خواهیم داد. موتورهای جستجو برای این كه از چند و چون و كیفیت یك وب‌سایت آگاه شوند، ابزارهایی را به كار می‌اندازند كه Spiders یا عنكبوت‌ها نام گرفته‌اند. آن‌ها محتوا، ساختار، چگونگی شكل‌گیری لینك‌ها، وضوح و روشنی مطالب، عناوین، كلمات كلیدی و نحوه پراكندگی آن‌ها در متن‌ها، اندازه پاراگراف‌ها و سادگی و پیچیدگی‌شان و معیارهای بسیار دیگری را مورد سنجش قرار می‌دهند و هر یك را ارزیابی می‌نمایند. در واقع عنكبوت‌ها ماموران نمره دادن به وب‌سایت‌ها هستند تا موتور جستجو بتواند جایگاه آن‌ها در لیست وب‌سایت‌هایش مشخص كند. این كار عنكبوت‌ها همان Page Ranking است. یعنی رده‌بندی صفحات وب‌سایت در موتور جستجو (رنكینگ). همه مطالب فوق درست بوده اهمیت راضی نگه داشتن عنكبوت‌ها محرز و آشكارست ولی از یك نكته مهم نیز نباید غفلت كرد : چیزی كه تعداد بازدیدكنندگان را افزایش داده نظرشان را جلب می‌كند، جالب بودن و یگانه بودن خود وب‌سایت است. به عبارت دیگر ظاهر و محتوای یك وب‌سایت باید در نظر یك كاربر واقعی، خوب و جالب توجه باشد. در این میان عناوین و تیترهای وب‌سایت نقش اصلی را بازی می‌كنند و محتوایی كه به دنبالشان می‌آید،‌ بر اعتبار عناوین و كلمات كلیدی آن می‌افزایند.
این كار از دو جهت به رشد و ارتقای وب‌سایت كمك می‌كند. یكی این كه به خاطر مرتبط بودن محتوای وب‌سایت و كلمات كلیدی با عنوان آن،‌ نمره‌ای كه موتور جستجو به آن می‌دهد بالا می‌رود و دیگر این كه بازدیدكنندگان بیشتر می‌شوند. اگر یك كاربر ببیند كه با مطالب و یافته‌های دلخواهش رو به رو شده می‌تواند از لینك‌های مفیدی كه با مطالب سایت مرتبط هستند هم استفاده كند، از وب‌سایت راضی می‌شود و امكان دارد كه همواره از همین وب‌سایت استفاده كند، ولی اگر هزاران كاربر به یك وب‌سایت سربزنند و در همان نگاه اول از ادامه كار منصرف شوند، هیچ كمكی نخواهند كرد. به بیان دیگر،‌ یك كاربر موثر و خوشحال و رضایتمند بیشتر از هزاران بازدیدكننده ناراضی به رنكینگ آن سایت كمك خواهد كرد. این نكته درباره صاحبان كسب و كار اینترنتی بسیار حیاتیست.
اگر بتوانید كاربرانی كه از وب‌سایت بازدید می‌كنند را جذب نمایید و با عرضه مطالب و كالا و خدماتی مرتبط با عنوان وب‌سایت‌ راضیشان كنید، احتمال موفقیت بالا خواهد رفت. آن‌ها می‌توانند به مشتریان دائمی تبدیل گردند و بارها و بارها به وب‌سایت مورد علاقه‌شان مراجعه كنند.
تدوین و نگارش یك عنوان جالب و گیرا كار ساده‌ای نیست و تعداد زیادی از صاحبان وب‌سایت‌ها در این باره با مشكل مواجهند. نكته مهم و اساسی اینست كه یك وب‌سایت قطعاً عناوین متعددی خواهد داشت كه چگونگی نگارش تك تك آنها و روش چیدمانشان، اموری تعیین‌كننده‌اند. لازم نیست بگوییم كه نخستین تیتر (h۱) كلیدی‌ترین عنصر در موفقیت یك وب‌سایت است و به جرات می‌توان گفت كه همین جمله است كه می‌تواند كاربر را به مطالعه وب‌سایت تشویق كند یا او را دلسرد نموده باعث شود كه به دنبال وب‌سایت دیگری بگردد. عنكبوت‌های موتورهای جستجو در ابتدای كارشان به این عناوین اصلی و فرعی توجه می‌كنند و میزان ارتباط محتوایی كه در پس آن‌ها می‌آیند را با كلمات كلیدی و خود جمله عنوان، سنجش می‌نمایند. میزان ارتباط عناوین با كلمات كلیدی موجود در متن وب‌سایت و چگونگی ارتباط محتوا با موضوع ذكر شده در عناوین، معیارهایی كلیدی هستند كه عنكبوت‌ها با توجه به آن‌ها جایگاه وب‌سایت را به موتور جستجو گزارش می‌دهند.
به عبارتی دو مسئله هستند كه می‌توانند نظر عنكبوت‌ها را جلب نموده راضیشان كنند.
۱) اول اینست كه عنوان اصلی و زیرمجموعه‌هایش از لغاتی كلیدی و شاخص محتوای سایت تشكیل شده باشند.
۲) دوم این كه با متونی كه بعد از آن‌ها می‌آیند همخوانی داشته هماهنگ و مرتبط باشند.
اگر در انجام این دو كار دقت كنید، شماره بهتری در لیست رده‌بندی موتور جستجو كسب خواهید كرد.
نكته دیگری كه مورد توجه موتورهای جستجوی بزرگ است، یافتن عناوین اصلی و فرعی در متون است. اگر آن‌ها بتوانند این لغات را به سادگی در صفحات بیابند، درخواهند یافت كه وب‌سایت درباره چیست و می‌توانند اطلاعات مورد جستجویشان را به سهولت پیدا كنند. اگر بخواهیم بیشتر توضیح دهیم. این‌طور می‌گوییم كه مرتبط بودن محتوای وب‌سایت با تیترهای اصلی و فرعی كاملاً واجب و ضروریست ولی باید توجه كرد كه اگر از جملات كلیدی یا همان تیترها استفاده نكنید، امتیاز لازم را كسب نخواهید كرد. به كارگیری این عبارات هم كار شما را راحت می‌كند و هم روند نمره دادن موتور جستجو را.
مسئله دیگر اینست كه هرگز سعی نكنید موتورهای جستجو را فریب دهید چرا كه فقط به ضرر خودتان تمام خواهد شد. بعضی از صاحبان وب‌سایت‌ها تلاش می‌كنند با انجام كارهایی ساده محتوای سایتشان را غنی و پربار جلوه دهند مثلاً عنوانی با لغات كلیدی بنویسند ولی این عنوان فرعی هیچ ربطی به مطالب زیرش ندارد. موتورهای جستجو و عنكبوت‌هایشان به این حقه‌ها بسیار حساس هستند و اگر حس كنند كه یك وب‌سایت و عناوین آن به نظر حقه‌باز می‌آیند و از چنین ترفندهایی استفاده كرده‌اند، نام و آدرس آن را به عنوان یك منبع برای رجوع كاربران درج نمی‌كنند. از همه بدتر این كه ممكن است نامش را در ردیف Spammer ها درج كنند. به این ترتیب كسب و كار وب‌سایت مزبور به عنوان یك مزاحم اینترنتی و فرستنده پیام‌های بیهوده معرفی می‌شود.
تا این‌جا همواره از "عنوان مرتبط و جذاب" حرف زدیم. راه حل اصلی و كارآمد برای مسئله اول،‌ یافتن لغاتی واقعاً كلیدی و گویاست. لغاتی كه در عین سادگی و قابل فهم بودن به شكلی مستقیم و بدون فكر كردن به بازدیدكننده‌تان برساند كه این وب‌سایت راجع به چیست و آیا می‌تواند مشكل او را حل كند یا مطالب و اطلاعات مورد نیازش را در اختیارش قرار دهد یا خیر. در پی این احساس، بازدیدكننده تصمیم می‌گیرد كه به مطالعه سایت ادامه بدهد یا منصرف شود. عاملی كه در این تصمیم‌گیری، حرف اول را می‌زند، جذابیت عنوان است. ممكن است یك عنوان كاملاً گویا باشد ولی جمله‌بندیش به فرمی كلیشه‌ای و یكنواخت تنظیم شده باشد. یك عنوان موثر همان لغات كلیدی را به شكلی كنار هم دارد كه خواننده را كنجكاو نموده به دقت و گشت و گذار در سایت تشویق می‌نماید. به او انگیزه داده محرك مطالعه مطالب را خلق می‌كند. این الزام‌ها درباره هر یك از عناوین فرعی هم صدق می‌كند. چرا كه خواننده سایت باید در پایان هر بخش،‌برای ادامه دادن محركی داشته باشد و انگیزه‌ای برایش فراهم گردد.
یكی از موثرترین روش‌های تشویق خواننده و بازدیدكننده شروع با یك عنوان پرسشی است. مثلاً شما به یك مشكل پرداخته‌اید و راجع آن اطلاع‌رسانی كرده برای حل آن كالا و خدماتی ارائه می‌كنید. اگر همان مشكل را در قالب یك پرسش مطرح كنید، كاربر كنجكاو می‌شود و برای یافتن راه‌حل به سراغ مطالب وب‌سایت می‌رود. جملاتی كه ناقص هستند هم كنجكاوی برانگیزند مثلاً "پنج راه برای . . ." و "یادگیری ماندگار با . . ." عناوین جذاب، منطقی،‌ مرتبط با مفاهیم و ساده و قابل فهم هم نمره شما را در لیست وب‌سایت‌های موتور جستجو بالا می‌برند و هم تعداد كاربران بازار هدف‌تان را افزایش می‌دهند.

By : Mark Nenadic
مترجم : آذین صحابی

منبع : روزنامه تفاهم

مطالب مرتبط

ساختار نمایه‌سازی در موتورهای کاوش وب

حجم وسیع اطلاعات بر روی شبكه وب باعث می‌گردد تا پاسخ‌دهی به كاوش‌های ارسالی از سوی كاربرن، بدون دسترسی به تمام متون و فقط با استفاده از فایل‌های نمایه صورت گیرد. بدین منظور، در سطح شبكه از روش‌های مختلف نمایه‌سازی استفاده می‌گردد. روش نمایهء انتهای كتاب، استفاده از ابرداده‌ها، شاخه‌های موضوعی و ساختار متمركز و پراكنده در فن‌آوری موتورهای كاوش از روش‌های دیگر می‌باشد.بسیاری از موتورهای كاوش از یك ساختار متمركز خزنده-نمایه‌ساز، سود می‌جونید. خزنده‌ها برنامه‌های نرم‌افزاری هستند كه عمل پیمایش وب را انجام داده و صفحات جدید و یا به روز در آمده را به سرویس‌دهنده‌ای كه قرار است این صفحات در آنجا نمایه شوند، می‌فرستند.در ساختار پراكنده كه بسیار موءثرتر از نوع متمركز است، مشكلات ناشی از استفاده از ساختار متمركز چون:
۱) دریافت درخواست صفحات، توسط خزنده‌های متفاوت موتورهای كاوش، از سرویس‌دهندگان وب؛
۲) افزایش ترافیك در وب به علت استخراج تمام اشیا و اجزا صفحات وب و نادیده گرفتن اكثر آن‌ها هنگام نمایه‌سازی؛
۳) جمع‌آوری اطلاعات بدون همكاری و آگاهی سایر خزنده‌ها و موتورهای كاوش، مورد توجه قرار گرفته و مرتفع شده است.
مقدمه
از زمان پایه‌گذاری وب جهانی در اواخردههء ۱۹۸۰، هیچ كس نمی‌توانست پیش‌بینی وضعیت و تأثیرات فعلی آن را بكند. رونق وب و رشد فزاینده آن بر كسی پوشیده نیست، به نحوی كه فقط میزان اطلاعات متنی قابل دسترس آن در حدود ۱ ترابایت تخمین زده می‌شود (Baeza-Yates, ۱۹۹۹).اندازه‌گیری حجم اطلاعات بر روی شبكه اینترنت به ویژه وب كار بسیار دشواری است. بر طبق آمارهایی كه گروه Cyveillance عرضه كرده است، بیش از ۱/۲ میلیارد صفحه اطلاعات، بدون تكرار و قابل دسترس تا نیمه دوم سال ۲۰۰۰ بر روی وب موجود بوده و برساس همین مطالعات نرخ رشد انفجاری صفحات وب ۷ میلیون در روز بوده است. (Pasore, ۲۰۰۰)این بدان معناست كه در حال حاضر تعداد صفحات وب، به میزان سه برابر آن افزایش یافته است و این اطلاعات، براساس آمار NetCraft (۲۰۰۲) به وسیله بیش از ۲۷ میلیون سرویس‌دهنده وب در اختیار مشتریان قرار می‌گیرد.
حجم وسیع اطلاعات بر روی شبكه وب باعث می‌گردد تا پاسخ‌دهی به كاوش‌های ارسالی را بدون دسترسی به تمام متون و فقط با استفاده از فایل‌های نمایه صورت دهیم زیرا در غیر این صورت یا بایستی نسخه‌ای از اطلاعات درخواستی به صورت محلی ذخیره گردد و یا تمام صفحات از راه دور و از طریق شبكه، در هنگام جستجو دسترس‌پذیر باشد كه این روش‌ها بسیار گران و كند است. تمام این‌ها تأثیر و اهمیت، تلاش برای بهبود روش‌های نمایه‌سازی و الگوریتم‌های جستجو را مشخص می‌سازد.براساس استاندارد نمایه‌سازی بریتانیا نمایه، ترتیب اصولی از مداخل است كه به منظور قادر ساختن استفاده‌كنندگان برای یافتن اطلاعات خود در یك مدرك ایجاد می‌شود. نمایه‌سازی وب كار ساده‌ای نیست و لذا برای كمك به درخواست‌كنندگان اطلاعات در رسیدن به آن در سطح شبكه از روش‌های مختلف نمایه‌سازی استفاده می‌گردد.
روش نمایه انتهای كتاب در وب
بسیاری از سایت‌های وب، برنامه‌ای برای جستجوی سایت خود طراحی كرده‌اند. این برنامه‌ها همچون جستجو در فایل‌های تمام متن می‌تواند در نتایج جستجوی خود دارای مدارك نامرتبط و در اصطلاح همراه با ریزش كاذب باشد.اگر در چنین سایت‌هایی نمایه‌ای شبیه آنچه در انتهای كتاب‌ها دیده می‌شود به وجود آید، مراجعه‌كننده می‌تواند به سرعت و با استفاده از لیست به مدخل مورد نظر خود وارد شود و با سرعت بالا و از دست دادن زمان كمتری به مدارك مورد نیاز خود وحتی به مدارك مرتبط با آن نیز دسترسی یابد.سایت وب شركت نرم‌افزاری Adobe با داشتن نمایه‌ای از نوع كواك(۱) و نیز موتور كاوش ویژه سایت، سعی در بالا بردن دسترس‌پذیری موءثر اطلاعات سایت خود نموده است.سایت دانشگاهی جورج تاون نیز نمایه موضوعی A-Z را در قسمت ابزارهای دسترسی به اطلاعات در صفحه خانگی خود قرار داده است.
ابرداده(۲) و وب
ابرداده به طور مكرر، داده‌ای برای داده تعریف شده است. این تعریف در عین ضروری بودن ناكافی است. ابرداده، داده‌ای است دربارهء داده، كه برای شرح منابع یا شیء اطلاعاتی پایه‌ریزی شده است و داده‌های منابع و روابط بین آن‌ها را تشریح می‌كند. پدیدآورندگان منابع، ناشران، كتابداران و سایر متخصصان اطلاع‌رسانی می‌توانند ابرداده را تولید كنند. ابرداده می‌تواند در درون منابع اطلاعاتی جاسازی(۳) و یا در كنار منبع اطلاعاتی و به طور مجزا حفظ شود. (Cleveland, ۲۰۰۱,P.۲۲۳)
قالب ابرداده‌ای دوبلین كور نمونه‌ای پیشنهادی از ابرداده است كه دستاورد نشست متخصصان اطلاع‌رسانی در دوبلین اوهایو به منظور حل مشكلات موجود در توصیف منابع اطلاعاتی موجود بر روی شبكه‌های كامپیوتری است. این نمونه‌ای از مفهوم پیوند بین ابرداده و وب است.شاخص‌های عنوان، پدیدآور، موضوع، ناشر، توصیف (همچون چكیده)، تاریخ ارائه، نوع مدرك، قالب(۴) (نیازهای سخت‌افزاری و نرم‌افزاری جهت ارائه مدرك)، برچسب منحصر به فرد شناسایی(۵)، محل تولید مدرك، زبان اصلی مدرك، چگونگی و محل ارتباط مدرك با سایر منابع، پوشش (بیانگر دامنه، محدوده و عمق مدرك) و مدیری حق موءلف، در قالب دوبلین كور پیشنهاد گردیده است. (Cleveland, ۲۰۰۱,P.۲۲۴)
شاخه‌های موضوعی
بعضی از ابزارهای جستجوی وب سعی در مرور سایت‌ها توسط افراد متخصص كرده و پس از تحلیل محتوی سایت، كلیدواژه مناسب را انتخاب و آن را در محل موضوعی، براساس لیست موضوعی ویژه خود قرار می‌دهند و در واقع یك راهنمای موضوعی را برای استفاده‌كننده فراهم می‌آورند. این در واقع به آن معناست است كه در زمانی كه موتور كاوش به طور معمول برای هدایت فرد به سایت، تمام صفحات آن سایت را نمایه كرده است، ولی از سوی دیگر یك راهنمای موضوعی بسیار شبیه یك پیوند به صفحه خانگی آن سایت تلقی می‌گردد. (Tyner, ۲۰۰۱).
سایت Open Directory و Looksmart دو نمونه بارز از این نوع سایت‌ها می‌باشند.
فن‌آوری موتورهای كاوش
ساختار متمركز
بسیاری از موتورهای كاوش از یك ساختار متمركز خزنده-نمایه‌ساز(۶) سود می‌جویند. خزنده‌ها برنامه‌های نرم‌افزاری هستند كه عمل پیمایش وب را انجام داده و صفحات جدید و یا به روز درآمده را به سرویس‌دهنده‌ای كه قرار است این صفحات در آنجا نمایه شوند، می‌فرستند. یك خزنده به عنوان نقطه شروع یك URL را دریافت كرده و انتقال صفحات وب را-همچون ایستگاه كاری كه صفحات را مرور می‌كند-به سرویس‌دهنده آغاز می‌نماید. پس از انتقال یك مدرك، سازه‌یاب(۷) شروع به استخراج واژه‌های مرتبط با متن كرده و آن‌ها را به پایگاه داده می‌افزاید. هر ركورد اطلاعاتی در این پایگاه شامل واژه استخراج شده و URL مربوط به آن می‌باشد. قابل ذكر است، تعدادی از خزنده‌ها واژه‌های موجود در بین برچسب‌هایی خاص نظیر، <TITLE>,<H۱>... و یا واژه‌های با بسامد بالا می‌نمایند.JumpstationII از این نوع است كه علاوه بر آن واژه‌های موجود در عناصر <HEADER> (<Hi>,۱<=I<=۶) و واژه‌های با بسامد بالا در برچسب <BODY> را استخراج می‌كند.خزنده WWWW واژه‌های موجود در عنصر URL, <TITLE> و <A> (ابر پیوندهای موجود در مدرك) را نمایه می‌كند.در حقیقت خزنده به درون رایانه نفوذ نمی‌كند، بلكه بر روی یك رایانه محلی اجرا شده و درخواست‌های خود را به رایانه‌های سرویس‌دهنده در نقاط مختلف ارسال می‌كند. عمل نمایه‌سازی در این روش به طور متمركز صورت می‌گیرد. شكل زیر ساختار نرم‌افزاری متمركز موتور كاوش AltaVista را نشان می‌دهد.اصلی‌ترین مشكل در این نوع ساختار، به دلیل طبیعت پویای وب، جمع‌آوری اطلاعات، پیوندهای ارتباطی اشباع شده به سرویس‌دهندگان وب و سربار شدن(۸) آن‌هاست. مشكل دیگر حجم اطلاعاتی است كه در حقیقت ساختار متمركز نمایه‌سازی توان مقابله با آن را ندارد. (Baeza-Yates, ۱۹۹۹, P.۳۷۴)
در واقع به دلیل درخواست‌های سریع ارسالی خزنده‌ها، و اشغال حجم قابل توجه‌ای از پهنای باند ارتباطی-و حتی تمام پهنای باند در حوزه‌های كوچك(۹)-و برای رفع این مشكل در ۳۰ ژوئن سال ۱۹۹۴ استانداردی را پدیدآوردگان برنامه‌های خزنده، برای محدودیت عمل برنامه‌های خودكار خزنده در سراسر وب به وجود آوردند. براساس این استاندارد، اگر ما می‌خواهیم خزنده‌ها از سرویس‌دهنده ما بازدید نكنند بایستی فایلی متنی با نام robots.txt بر روی ریشه(۱۰) سرویس‌دهندهء وب خود قرار دهیم و براساس توافقات پدیدآوردندگان خزندگان یا روبوت‌ها، این برنامه بایستی در اولین مرحله به دنبال این فایل در روی سرویس‌دهندهء وب جستجو كند و در صورت وجود به فرامین قرار داده شده در آن پاسخ داده و سپس به اعمال دیگر بپردازد.
البته با استفاده از ابربرچسب(۱۱) ROBOTS نیز می‌توان از نمایه شدن صفحهء وب توسط روبوت جلوگیری كرد. (Sullivan, ۲۰۰۰)
<HEAD>
<TITILE>Page I Don`t Want To Search Engines</TITLE>
<META NAME=”ROBOTS” CONTENT =”NOINDEX”>
</HEAD>
ساختار پراكنده
این نوع ساختار بسیار موءثرتر از نوع متمركز است و مشكلات ناشی از استفاده از ساختار متمركز چون:
۱) دریافت درخواست صفحات، توسط خزنده‌های گوناگون موتوهای كاوش، از سرویس‌دهندگان وب،
۲) افزایش ترافیك در وب به علت استخراج تمام اشیا و اجزا صفحات وب و نادیده گرفتن اكثر آن‌ها هنگام نمایه‌سازی؛
۳) جمع‌آوری اطلاعات بدون همكاری و آگاهی سایر خزنده‌ها و موتورهای كاوش، در این ساختار مورد توجه قرار گرفته و مرتفع شده است.برای رفع مشكلات ذكر شده، Harvest یكی از مهمترین مدل‌ها در این نوع دو عنصر اصلی را معرفی می‌كند: گردآورنده(۱۲) و واسط(۱۳). (Baeza-Yates, ۲۰۰۰, P.۳۷۵).گردآورنده یك نرم‌افزار خودكار است كه بر روی سرویس‌دهندهء وب اجرا می‌شود و عمل جمع‌آوری و استخراج اطلاعات لازم برای فایل نمایه را انجام می‌دهد. البته این نرم‌افزار بر روی سایر سرویس‌دهنده‌گان وب نیز می‌توان اجرا شود كه این خود با ساختار Haverst در تناقض است.واسط به استخراج اطلاعات از گردآورنده‌ها پرداخته و ضمن ایجاد یك نمایه قابل جستجو، واسط كاربری آن را نیز فراهم می‌كند. همان گونه كه دیده می‌شود، یك نرم‌افزار گردآورنده بر روی سرویس‌دهندهء وب، بدون هیچ ترافیك خارجی اجرا شده و اطلاعات جمع‌آوری شده به چندین واسط قابل ارسال می‌باشد. هر واسط می‌تواند بعد از فیلتر كردن اطلاعات آن را به سایر واسط‌ها ارسال كند.یكی از اهداف Harvest ایجاد واسط‌های ویژه موضوعی(۱۴) و اجتناب از حوزهء وسیع لغات و مشكلات نمایه‌های عمومی است.ساختار Harvest، تكراركننده‌ها و حافظه‌های نهانی اشیا(۱۵) را نیز جهت افزایش سرعت دسترسی به پایگاه داده‌ها فراهم می‌كند. امروزه برنامه‌های كاربردی این شیوه در مراكزی چون ناسا(۱۶) و آكادمی ملی علوم آمریكا مورد استفاده قرار می‌گیرد و نمونه مورد استفاده در بخش تجاری در وب، سرویس‌دهنده فهرست، شركت Netscape است.نمونه‌ای از ساختار Harvest در شكل زیر دیده می‌شود:
نتیجه‌گیری
افزونی افسار گسیخته اطلاعات بر روی شبكه وب، متخصصان رایانه و اطلاع‌رسانی را در جهت بهبودی كارائی نظام‌های نمایه‌سازی و به تبع آن بازیابی اطلاعات سوق می‌دهد.حركت از سوی نمایه‌های دست‌ساز تا نمایه‌های خودكار و ارائهء شیوه‌های گوناگون آن، به جهت سرعت بخشیدن برای ارائهء اطلاعات و رفع مشكلات فنی موجود بوده است. با وجود این علیرغم خوش‌بینی در مورد ابزارهای نمایه‌ساز و جستجوگر، هنوز هم بازیابی موضوعی در هر پایگاهی، بر اساس نمایه‌سازی كلیدواژه‌ای صورت می‌گیرد و جستجو براساس منطق بولی بوده و ریزش كاذب در آن قابل توجه است.اهداف آتی در این حوزه، مطالعه هر چه بیشتر پردازش اطلاعات توسط انسان و چگونگی فهم انسان از اطلاعات و رسیدن به نظام‌های هوشمند نمایه‌ساز و بازیاب، با استفاده از تجارب و نتایج امیدواركنندهء حوزه‌هایی نظیر هوش مصنوعی و نظام‌های خبره می‌باشد.
پی‌نوشت‌ها
۱. KeyWord In Context
۲. Metadata
۳. Embedded
۴. Format
۵. Identifier
۶. Crawler-indexer
۷. Parser
۸. High load
۹. Domain
۱۰. Root
۱۱. Meta Tag
۱۲. Gathere
۱۳. Broker
۱۴. Topic-specific
۱۵. Object Cache
۱۶. NASA
منابع
۱.American Society of Indexer. Main Page: http://www.asindexing.org
۲. Baeza-Yates, Ricardo;Ribeiro-Note, Berthier (۱۹۹۹). Modern Information Rerieval. NewYork: ACM Press
۳. Cleveland, Donald B.; Cleveland, Ana D. (۲۰۰۱). Introduction to Indexing and Abstracting. Englewood: Libraries Unlimited
۴. Distributed Indexing Systems for Organizing the Web:
http://eubdl.ugr.es/temp/serbydor/g۹/know۴_i.htm
۵. George Town University website: http://www.gerogertown.edu
۶. Netcraft. Main Page: http://www.netcraft.com
۷. Open Directory Homepage: http://www.dmoz.org
۸. Pastore, Michael (۲۰۰۰). The Web: More Than ۲ Billion Pages Strong
http://cyberatlas.internet.com/big_picture/traffic_patterns/article/۰,,۵۹۳۱_۴۱۳۶۹۱,۰۰.htm
۹. Sullivan, Danny (۲۰۰۰). How to use HTML Meta Tags.
http://searchenginewatch.com/webmasters/meta.html
۱۰. Toward the automation of a routine task: Using Spidrs to index the Web:
http://eubdl.ugr.es/temp/serbydor/g۹/know۲_i.htm
۱۱. Tyner, Ross(۲۰۰۱). Sink or Swim: Internet Search Tools & Techniques.
http://www.ouc.bc.ca/libr/connect۹۶/search.html

نوشته: احمد كمیجانی
دانشجوی كارشناسی ارشد اطلاع‌رسانی

وبگردی
وقتی یک دامدار با مدرک دیپلم و ۱۱۹ فقره چک برگشتی مدیرعامل «ثامن‌الحجج» شد
وقتی یک دامدار با مدرک دیپلم و ۱۱۹ فقره چک برگشتی مدیرعامل «ثامن‌الحجج» شد - تصاویر با شما سخن می گویند؛ تصاویری بی روتوش با سخنانی بی روتوش‌تر؛ می‌خواهیم با بخش خبری «فوتونیوز»، مقامات با شما بی روتوش و رودررو سخن بگویند. از این پس، عصرگاه هر روز با «فوتو نیوز» تابناک، حرف و سخن مقامات داخلی و خارجی را به عکس بی روتوش‌شان الصاق می‌کنیم، تا بهتر بدانیم چه کسی حرف زده و از چه سخن گفته است. کوتاه و مختصر؛ به احترام وقت شما و فرصتی که برای دانستن می‌گذارید.
جزییاتی تکان‌دهنده از اقدامات موسسه ثامن‌الحجج
جزییاتی تکان‌دهنده از اقدامات موسسه ثامن‌الحجج - دو چهره مشهور تلویزیون نیز از مواهب موسسه ثامن الحجج بی نصیب نبوده‌اند. مؤسسه ثامن‌الحجج دو مبلغ ۱۸۰ میلیون‌تومانی و ۴۰۰ میلیون‌تومانی را به حساب «م.م» مجری یک برنامه تلویزیونی واریز می‌کند و عنوانی که روبه‌روی این اعداد در توضیح دلیل وجه ذکر شده، یک کلمه است؛ هدیه. اما رقم هدیه‌ای که آقای «م.م» به‌عنوان هدیه دریافت کرده، در مقابل تسهیلات دریافتی او از ثامن‌الحجج تقریبا ناچیز است.
ترجیح می‌دهید کدام‌ زن همکار شوهر شما باشد!
ترجیح می‌دهید کدام‌ زن همکار شوهر شما باشد! - یک بنر تبلیغاتی که ظاهراً با هدف ترویج فرهنگ حجاب طراحی شده، سبب‌ساز واکنش‌های کاربران شبکه اجتماعی توییتر شده است. در این بنر، از رهگذران خواسته شده بین دو گزینه موجود، زنی چادری و زنی مانتویی، انتخاب کنند ترجیح می‌دهند کدام‌یک همکار همسرشان باشد!
نمایش دستاورد آزادی و دموکراسی
نمایش دستاورد آزادی و دموکراسی - آقای مطهری بازیکنان آفریقایی تیم فرانسه را دیده ولی دورگه‌های تیم ملی خودمان را ندیده!
فیلم قتل عجیب زن جوان توسط شوهرش در اسلامشهر!
فیلم قتل عجیب زن جوان توسط شوهرش در اسلامشهر! - در اتفاقی عجیب و غیر قابل باور فردی امروز به دلیل درخواست طلاق همسرش در خیابان اسلامشهر وی را با ضربات چاقو از پای درآورد، از سرنوشت این خانم اطلاع دقیقی در دست نیست.
مائده‌ها و دلارهای رانتی
مائده‌ها و دلارهای رانتی - اشارت‌هایی که برخی نکات جالب توجهی دیگری در خصوص آن بیان می‌کنند، مثل مطرح شدن مساله مانتو‌های جلوباز و اشکالی که برخی مسئولان به آن وارد می‌دانند. موضوعی که موجب شد تا بعد از مدت‌های مدید و در شرایطی که بسیاری بر این باورند که شناسایی و مقابله با اخلال گران بازار می‌بایست در اولویت همه امور باشد، گشت‌های ارشاد به خیابان‌ها باز گردند.
دورهمی کثیف‌ترین برنامه جنسی  ! تفکرات پیچیده یک استاد علوم انسانی !
دورهمی کثیف‌ترین برنامه جنسی ! تفکرات پیچیده یک استاد علوم انسانی ! - یکی از بحث های جنجالی دکتر فیاض در سال های اخیر اظهار نظر او در مورد وقوع بحران جنسی در ایران بوده است که حالا او معتقد است تبدیل به انقلاب جنسی شده است. با او در این زمینه مصاحبه مفصلی انجام دادیم که به زودی منتشر می شود. بخشی از این مصاحبه که درباره برنامه دورهمی است را تماشا کنید.
آغوش جنسی یا مادرانه ! مشغله فکری مطهری
آغوش جنسی یا مادرانه ! مشغله فکری مطهری - وی در بخش دیگری از صحبت‌هایش با اشاره به نمایش در آغوش کشیدن تیم ملی کروواسی توسط رئیس‌جمهور کشورشان،گفت: ایشان با یک حس مادرانه این کار را انجام داد و این آغوش، جنسی نبود، البته که پخش آن نباید انجام می‌شد.
کدام پسر روحانی سه تابعیتی است؟
کدام پسر روحانی سه تابعیتی است؟ - سرنوشت فرزند بزرگ حسن روحانی از جمله مواردی است که در سال‌های گذشته بارها مورد توجه رسانه‌ها قرار گرفته است. پیش از برگزاری انتخابات ریاست‌جمهوری سال ۹۲ نیز یکی از وب‌سایت‌های اصولگرا مدعی بود که او به دنبال “شکست عشقی” دست به “خودکشی” زده است. بنا به ادعای برخی از رسانه‌های اصو‌لگرا، فرزند روحانی با کلت کمری پدر خودکشی کرد.
فیلم منزل محمود خاوری درکانادا
فیلم منزل محمود خاوری درکانادا - کاربران شبکه های اجتماعی فیلمی را منتشر کرده اند که گفته می شود مربوط به خانه مجلل محمود خاوری در کانادا است. صحت و سقم این قضیه هنوز تایید نشده است.
چرا آیت‌الله جنتی اینگونه فکر می‌کند؟
چرا آیت‌الله جنتی اینگونه فکر می‌کند؟ - احزاب و شخصیت‌ها - زندگی ساده آیت‌الله جنتی گرچه از ویژگی‌های مثبت شخصیت وی است اما نوع نگاهش به عرصه سیاسی و مصداق‌یابی های وی درخصوص افراد انقلابی انتقادهای زیادی را متوجه او می‌کند.
مائده هژبری و امیرحسین مقصودلو در استانبول
مائده هژبری و امیرحسین مقصودلو در استانبول - امیرحسین مقصودلو (تتلو) با انتشار عکسی از خودش و مائده هژبری، دختر نوجوانی که پس از اعتراف تلویزیونی اش معروف شد، از کنسرت مشترک در استانبول خبر داد.
واکنش فغانی به انتشار تصاویردست دادنش با داور زن برزیلی:کوچکترین اهمیتی برایم ندارد!
واکنش فغانی به انتشار تصاویردست دادنش با داور زن برزیلی:کوچکترین اهمیتی برایم ندارد! - تصاویر با شما سخن می گویند؛ تصاویری بی روتوش با سخنانی بی روتوش‌تر؛ می‌خواهیم با بخش خبری «فوتونیوز»، مقامات با شما بی روتوش و رودررو سخن بگویند. از این پس، عصرگاه هر روز با «فوتو نیوز» تابناک، حرف و سخن مقامات داخلی و خارجی را به عکس بی روتوش‌شان الصاق می‌کنیم، تا بهتر بدانیم چه کسی حرف زده و از چه سخن گفته است. کوتاه و مختصر؛ به احترام وقت شما و فرصتی که برای دانستن می‌گذارید.
اول مرگ بر ربا بعد مرگ برآمریکا
اول مرگ بر ربا بعد مرگ برآمریکا - صحبت های تامل برانگیز آیت الله رودباری درمورد ربا در کشور
مرد رو‌به‌روی مائده هژبری کیست؟
مرد رو‌به‌روی مائده هژبری کیست؟ - دختر بازداشت شده در بخشی از مصاحبه توضیح می‌دهد که صبح دستگیر شده و خانواده‌اش در جریان این موضوع قرار گرفته‌اند و این ادعا نشان می‌دهد تهیه فیلم اعترافات به فاصله یک صبح تا عصر انجام شده که خود نشان‌دهنده این است که برای متهم هنوز دادگاهی تشکیل نشده و جرمی به اثبات نرسیده ‌است.
فیلم | رامبد: دهنتو ببند، فرح‌بخش: دهنتو گِل بگیر!
فیلم | رامبد: دهنتو ببند، فرح‌بخش: دهنتو گِل بگیر! - پس از آنکه فیلم تازه محمدحسین فرح‌بخش در سالن‌های سینمای شهر تهران اکران نشد. احمدی مدیر سینماشهر که از قضا تهیه کننده برنامه خندوانه نیز هست و سوله مدیریت بحران شهر تهران در دوره تهیه کنندگی او به «خندوانه» اختصاص یافت، مانع از این اکران شده بود و همین مسئله واکنش فرح بخش را به دنبال داشت و او را رانت‌‎‌خوار خواند و پای رامبد جوان را به میان کشید.
شاخ‌های اینستاگرامی که نمی‌شناختیم
شاخ‌های اینستاگرامی که نمی‌شناختیم - یکی از دختران که به شدت مورد توجه قرار گرفته است مائده نام دارد. او از چهره‌های شناخته شده اینستاگرام است که ویدئو‌هایی از رقص هایش را در صفحه خود منتشر کرده است. او متولد سال 1380 است. به گفته خودش حدود 600هزار فالوئر دارد. او حالا با قرار وثیقه آزاد است.
تصادف سردار آزمون با پورشه اش (عکس)
تصادف سردار آزمون با پورشه اش (عکس) - سردار آزمون نیمه شب گذشته و در نزدیکی‌های صبح امروز با خودوری پورشه شخصی خود در محور نکا بهشهر پس از عبور از روستای کمیشان با تصادف زنجیره‌ای مواجه شد که در این حادثه خودروهای زیادی خسارت دیدند