پنج شنبه ۶ اردیبهشت ۱۳۹۷ / Thursday, 26 April, 2018

کارگر‌های اطلا‌عاتی و ۱۰ قاعده طلا‌یی گوگل


کارگر‌های اطلا‌عاتی و ۱۰ قاعده طلا‌یی گوگل
اریک اشمیت، مدیرعامل گوگل، چندی پیش در مقاله‌ای در نشریه نیوزویک، قواعد طلا‌یی کسب‌وکار یکی از برترین شرکت‌های دیجیتالی جهان را تشریح کرد. اگرچه رهبران گوگل بر خلا‌ف رهبران مایکروسافت، در انتشار مقاله و گزارش تخصصی، فعالیت کم‌تری دارند، اما مطالبی که هر از گاهی توسط آنان ارائه می‌شود، قابل تامل است. متن حاضر، روایتی است از راهکارهایی که گوگل در کسب‌وکار در دنیای دیجیتال به آنها وابسته است. اریک اشمیت به این واقعیت اشاره دارد که خلا‌قیت و پرورش خلا‌قیت در کارکنان یک شرکت، رمز پیروزی در شرکت‌های دیجیتالی امروز جهان است. این خلا‌قیت است که کارآفرینی دیجیتالی را به بهترین شکل ممکن پرورش و هدایت می‌کند و این تضمینی برای بقا در دهکده جهانی است.
در گوگل، ما پیتر دراکر (پدر مدیریت نوین در قرن بیستم) را به عنوان یک معلم تجارت معروف می‌شناسیم که می‌تواند کارگرهای اطلا‌عاتی جدیدی را پرورش دهد. دروکر واژه کارگر‌های اطلا‌عاتی را در سال ۱۹۵۹ ابداع کرد. او بر این عقیده بود که کارگرهای اطلا‌عاتی کارگرهایی هستند که باور داشته باشند که مفید و موثرند نه اینکه مانند دیگران فقط از ساعت ۵ تا ۹ صبح بر اساس وظیفه سر کار بروند. شرکت‌ها و سازمان‌هایی که به دنبال این گونه کارمندان بروند و از آنها بهره بگیرند می‌توانند به عنوان شرکت‌های برتر در ۲۵ سال آینده معرفی گردند. در واقع گوگل نیز مبنای کار خود را بر چنین اساسی پایه‌ریزی کرده است. بحث در مورد این موضوع که آیا شرکت‌های بزرگ می‌توانند این کارکنان اطلا‌عاتی را مدیریت کنند یکی از بحث‌های اصلی در سال‌های گذشته بوده است. به دلیل اینکه عدم مدیریت درست در این بخش باعث از کار افتادن شرکت خواهد شد این موضوع از اهمیت ویژه‌ای برخوردار است مباحثی که در اینجا مطرح می‌کنیم ۱۰ قانون اصلی است که ما برای موثر بودن کارکنان اطلا‌عاتی به شما معرفی می‌کنیم. به دلیل اینکه در بسیاری از کارخانه‌ها کارکنان اطلا‌عاتی اصلی مهندسان هستند در اینجا نیز مبنای کار ما مهندسان خواهند بود. اما بعضی از این قانون‌ها به دیگر کارکنان نیز تعلق دارد.
۱) به وسیله تشکیل کمیته و شورا اقدام به استخدام کنید
به طور کلی کسی که در گوگل درخواست استخدام را مطرح می‌کند حدود ۱۲ مصاحبه مختلف را پشت سر می‌گذارد تا استعدادها و مهارت‌های او مشخص شود. هر کدام از اعضای کمیته، نظر خود را ابراز می‌کنند. این عملیات باعث می‌شود تا استانداردهای کار بالا‌تر رود. درست است که زمان بیشتری را صرف می‌کند ولی ما فکر می‌کنیم که ارزش آن را دارد. اگر شما افراد با قابلیت را استخدام کنید و در هنگام مصاحبه به آنها فشار زیادی را وارد کنید، باعث می‌شود تا آنها نیز مهارت خود را به نمایش بگذارند ما از ابتدا در گوگل به این صورت شروع به استخدام کردیم و مبنای کار مان در این شرکت اینگونه کارکنان هستند.
۲) خواسته‌های آنان را فراهم کنید
همانطور که دروگر می‌گوید: همه چیزهای مزاحم را از جلوی آنان بردارید. ما امکانات استانداردی را برای آنها ترتیب داده‌ایم که شامل اسباب و وسایل نهار خوری، باشگاه ورزشی، رختشوی‌خانه، اتاق ماساژ، آرایشگاه، کارواش، خشک شویی‌، اتوبوس‌های ایاب‌وذهاب و هر چیز دیگری که یک مهندس به آن احتیاج دارد. به این نکته توجه داشته باشید که برنامه‌نویس‌ها دوست دارند که فقط برنامه نویسی کنند. دیگر احتیاجات آنها را ما برآورده می‌کنیم.
۳) ‌مکان کار آنها را نزدیک به هم قرار دهید
تقریبا تمام پروژه‌ها در گوگل پروژه‌های تیمی هستند و اعضای تیم‌ها احتیاج به برقراری ارتباط با یکدیگر دارند. بهترین راه برای ارتباط برقرار کردن آنها این است که اعضای تیم‌ها را در هنگام کار نزدیک به هم قرار دهید. در واقع اداره را به محلی برای به اشتراک گذاشتن تفکرها تبدیل کنید. با این روش هنگامی‌که یک برنامه‌نویس می‌خواهد با همکار خود صحبت کند دسترسی آسان خواهد بود، نه تلفن، نه ایمیل و نه هیچ زمان از دست رفته‌ای برای پاسخ. همچنین اتاق‌های کنفرانسی وجود دارد که برنامه‌نویسان می‌توانند به طور ساعتی از آن برای مشورت کردن استفاده کنند. در واقع نشستن در کنار یک برنامه‌نویس بزرگ می‌تواند بسیار با ارزش باشد.
۴‌) هماهنگی
به دلیل اینکه برنامه‌نویسان در فاصله کمی از یکدیگر قرار دارند. درصد هماهنگی نیز بالا‌ خواهد رفت. چون هر برنامه‌نویس قادر خواهد بود که به آسانی و بدون تلف کردن وقت بفهمد که اعضای گروه خود در حال حاضر در کدام بخش از پروژه قرار دارند. آیا او نیز همراه آنان است یا از برنامه عقب است و این به دلیل فاصله نزدیکی فیزیکی آنان خواهد بود.
۵) ‌استفاده نامحدود کارکنان از ابزارهای شرکت
یکی از این ابزارها وب است. صفحات داخلی وب که در داخل شرکت برای انجام پروژه‌ها استفاده می‌شود. آنها به طور کامل اندیس‌گذاری می‌شوند و برای اعضای تیم پروژه قابل استفاده خواهد بود.به عنوان مثال یکی از دلا‌یل موفقیتGmail آزمایش شدن این سرویس به طور مکرر بود. یعنی خود کارکنان با صفحات وب داخلی شرکت ماه‌ها این سرویس را مورد بررسی قرار دادند. بعداز مدتی آن را روانه بازار کردند و می‌بینید که به موفقیت بسیاری نیز دست یافته است.
۶‌) خلا‌قیت را تشویق کنید
مهندسان گوگل ۲۰% از وقتشان را فقط برای انتخاب پروژه مصرف می‌کنند. البته این زمان از دست نرفته و باعث می‌شود که پروژه‌های خوبی حاصل شود. اما به طور عمومی‌ما به انسان‌های خلا‌ق اجازه می‌دهیم که خلا‌ق باشند. یکی از سلا‌ح‌های نا مخفی ما نظریات ارسال شده به وسیله پست است. صندوق پستی که مردم از سراسر دنیا پیشنهادات و انتقادات خود را برای ما بوسیله آن ارسال می‌کنند. در واقع ما اجازه می‌دهیم تا خود مردم آن چیز را که می‌پسندند ارائه دهند و ما روی آن طرح‌ها کار کنیم.
۷)‌ تلا‌ش برای رسیدن به رضایت عمومی
در واقع در سیستم‌های مشارکتی ما همیشه یک تصمیم گیرنده نهایی وجود دارد. ما به این قضیه معتقدیم که افراد بیشتر بسیار باهوش‌تر از افراد کمتر هستند.و در واقع ما یک پهنای اطلا‌عاتی قبل از تصمیم‌گیری نیاز داریم. در گوگل نقش مدیر در واقع یک جمع کننده نظرات است نه یک دیکتاتور. در تصمیم، رسیدن به رضایت عمومی‌گاهی اوقات بسیار طول می‌کشد. اما همیشه پروژه‌ای کامل‌تر بوده است که تیمی‌تر بوده است.
۸‌) زیان آور نباشید
مطالب زیادی در مورد شعار گوگل نوشته شده است که ما سعی می‌کنیم با آن زندگی کنیم. همانطور که در تمام موسسات و سازمان‌ها افراد در مورد نظراتشان احساساتی هستند در گوگل نیز چنین است.در گوگل هیچ کس به صندلی مدیریت نمی‌رسد مگر اینکه مبتکر طرح‌های نوین باشد. ما در واقع جوی از تحمل و احترام در مقابل نظرات مردم به راه‌انداخته‌ایم نه جوی که در آن پر از بله در مقابل نظرات مردم باشد.
۹) ‌داده‌ها تصمیمات را حرکت می‌دهند
.در گوگل تمام تصمیمات بر مبنای تجزیه و تحلیل گرفته میشود. ما سیستمی را برای مدیریت اطلا‌عات به راه‌انداخته‌ایم که نه تنها در وب بلکه در داخل شرکت‌مان نیز ما را یاری می‌رساند. در همین راستا آنالیزورهایی را استخدام کرده ایم که به سختی بر روی داده‌ها کار می‌کنند و ما را به روز نگه می‌دارند.
۱۰) بطور موثر ارتباط برقرار کنید
هر جمعه ما مجمعی برای آگاهی دادن، معرفی، سوال و جواب ( و البته نوشیدنی و غذا) را برگزار می‌کنیم. این مجمع به مدیران اجازه می‌دهد تا هر هفته با کارکنان خود انتخاب بر قرار کنند و یا بالعکس. گوگل اطلا‌عات خود را به طور وسیعی برای دیگر سازمان‌ها یا موسسات منتشر می‌کند. برخلا‌ف دیگران ما بر این باوریم که قانون اول، دومی‌را می‌سازد یعنی پشت گرم بودن کارکنان در کار باعث وفا داری آنها در کار می‌شود. مهندسان به طور طبیعی روحیه رقابتی دارند. آنها در مقابل افرادی که دانش شان پایین‌تر است تحمل و دوام ندارند. اما نقریبا تمام پروژه‌های مهندسی تیمی هستند، داشتن یک فرد باهوش اما نا منعطف در تیم واقعا مرگ آور است.اگر ما جملا‌تی مانند «باهوش‌ترین فردی که تا به حال دیدم» یا «می‌خواهم دوباره با او کار کنم» را از گروهی شنیدیم باید در پروژه‌های بعدی نیز آنها را در یک تیم قرار دهیم. یک مهندس خوب همیشه به این امر معتقد است که پروژه‌ای که در دست اوست باید بهتر از پروژه‌های قبلی باشد. برای تحقق یافتن این امر آنها باید کار تیمیشان را بالا‌تر ببرند و سعی کنند تا بوسیله کار تیمی این امر را استحقاق بخشند. نکته آخر این است که گوگل در حال رشد کردن است. دلیل این پیشرفت هم همین ارتباطات است.
جلسات روز جمعه برای به دست آوردن یک دید جمعی از تیم است. به این نکته توجه داشته باشید که گوگل در حال حاضر یک سازمان است.ما باید بر روی مدیریت خلا‌قیت و ابداع و ابتکار تمرکز کنیم. اما این تنها نقطه تمرکز در گوگل نیست. ما باید عملیات‌ها و کارهایمان را نیز به طور روز به روز مدیریت کنیم و این کار ساده‌ای نیست. ما در واقع در حال ساختن زیر بنا و پایه تکنولوژی هستیم که بسیار بزرگ‌تر و پیچیده‌تر از چیزهایی است که در تاریخ بشر ساخته شده است.آنهایی که برنامه‌ریزی می‌کنند.یعنی این سیستم را برنامه‌ریزی و اجرا می‌کنند باید دارای انگیزه بالا‌یی باشند. در گوگل عملیات‌ها فقط آزمایشی نیستند بلکه آنها برای موفقیت مجموعه بسیار مهم هستند. به این دلیل باید سعی کنیم که در تمام پروژه‌ها موفق باشیم.


منبع : سایت حسابیران

مطالب مرتبط

ساختار نمایه‌سازی در موتورهای کاوش وب

حجم وسیع اطلاعات بر روی شبكه وب باعث می‌گردد تا پاسخ‌دهی به كاوش‌های ارسالی از سوی كاربرن، بدون دسترسی به تمام متون و فقط با استفاده از فایل‌های نمایه صورت گیرد. بدین منظور، در سطح شبكه از روش‌های مختلف نمایه‌سازی استفاده می‌گردد. روش نمایهء انتهای كتاب، استفاده از ابرداده‌ها، شاخه‌های موضوعی و ساختار متمركز و پراكنده در فن‌آوری موتورهای كاوش از روش‌های دیگر می‌باشد.بسیاری از موتورهای كاوش از یك ساختار متمركز خزنده-نمایه‌ساز، سود می‌جونید. خزنده‌ها برنامه‌های نرم‌افزاری هستند كه عمل پیمایش وب را انجام داده و صفحات جدید و یا به روز در آمده را به سرویس‌دهنده‌ای كه قرار است این صفحات در آنجا نمایه شوند، می‌فرستند.در ساختار پراكنده كه بسیار موءثرتر از نوع متمركز است، مشكلات ناشی از استفاده از ساختار متمركز چون:
۱) دریافت درخواست صفحات، توسط خزنده‌های متفاوت موتورهای كاوش، از سرویس‌دهندگان وب؛
۲) افزایش ترافیك در وب به علت استخراج تمام اشیا و اجزا صفحات وب و نادیده گرفتن اكثر آن‌ها هنگام نمایه‌سازی؛
۳) جمع‌آوری اطلاعات بدون همكاری و آگاهی سایر خزنده‌ها و موتورهای كاوش، مورد توجه قرار گرفته و مرتفع شده است.
مقدمه
از زمان پایه‌گذاری وب جهانی در اواخردههء ۱۹۸۰، هیچ كس نمی‌توانست پیش‌بینی وضعیت و تأثیرات فعلی آن را بكند. رونق وب و رشد فزاینده آن بر كسی پوشیده نیست، به نحوی كه فقط میزان اطلاعات متنی قابل دسترس آن در حدود ۱ ترابایت تخمین زده می‌شود (Baeza-Yates, ۱۹۹۹).اندازه‌گیری حجم اطلاعات بر روی شبكه اینترنت به ویژه وب كار بسیار دشواری است. بر طبق آمارهایی كه گروه Cyveillance عرضه كرده است، بیش از ۱/۲ میلیارد صفحه اطلاعات، بدون تكرار و قابل دسترس تا نیمه دوم سال ۲۰۰۰ بر روی وب موجود بوده و برساس همین مطالعات نرخ رشد انفجاری صفحات وب ۷ میلیون در روز بوده است. (Pasore, ۲۰۰۰)این بدان معناست كه در حال حاضر تعداد صفحات وب، به میزان سه برابر آن افزایش یافته است و این اطلاعات، براساس آمار NetCraft (۲۰۰۲) به وسیله بیش از ۲۷ میلیون سرویس‌دهنده وب در اختیار مشتریان قرار می‌گیرد.
حجم وسیع اطلاعات بر روی شبكه وب باعث می‌گردد تا پاسخ‌دهی به كاوش‌های ارسالی را بدون دسترسی به تمام متون و فقط با استفاده از فایل‌های نمایه صورت دهیم زیرا در غیر این صورت یا بایستی نسخه‌ای از اطلاعات درخواستی به صورت محلی ذخیره گردد و یا تمام صفحات از راه دور و از طریق شبكه، در هنگام جستجو دسترس‌پذیر باشد كه این روش‌ها بسیار گران و كند است. تمام این‌ها تأثیر و اهمیت، تلاش برای بهبود روش‌های نمایه‌سازی و الگوریتم‌های جستجو را مشخص می‌سازد.براساس استاندارد نمایه‌سازی بریتانیا نمایه، ترتیب اصولی از مداخل است كه به منظور قادر ساختن استفاده‌كنندگان برای یافتن اطلاعات خود در یك مدرك ایجاد می‌شود. نمایه‌سازی وب كار ساده‌ای نیست و لذا برای كمك به درخواست‌كنندگان اطلاعات در رسیدن به آن در سطح شبكه از روش‌های مختلف نمایه‌سازی استفاده می‌گردد.
روش نمایه انتهای كتاب در وب
بسیاری از سایت‌های وب، برنامه‌ای برای جستجوی سایت خود طراحی كرده‌اند. این برنامه‌ها همچون جستجو در فایل‌های تمام متن می‌تواند در نتایج جستجوی خود دارای مدارك نامرتبط و در اصطلاح همراه با ریزش كاذب باشد.اگر در چنین سایت‌هایی نمایه‌ای شبیه آنچه در انتهای كتاب‌ها دیده می‌شود به وجود آید، مراجعه‌كننده می‌تواند به سرعت و با استفاده از لیست به مدخل مورد نظر خود وارد شود و با سرعت بالا و از دست دادن زمان كمتری به مدارك مورد نیاز خود وحتی به مدارك مرتبط با آن نیز دسترسی یابد.سایت وب شركت نرم‌افزاری Adobe با داشتن نمایه‌ای از نوع كواك(۱) و نیز موتور كاوش ویژه سایت، سعی در بالا بردن دسترس‌پذیری موءثر اطلاعات سایت خود نموده است.سایت دانشگاهی جورج تاون نیز نمایه موضوعی A-Z را در قسمت ابزارهای دسترسی به اطلاعات در صفحه خانگی خود قرار داده است.
ابرداده(۲) و وب
ابرداده به طور مكرر، داده‌ای برای داده تعریف شده است. این تعریف در عین ضروری بودن ناكافی است. ابرداده، داده‌ای است دربارهء داده، كه برای شرح منابع یا شیء اطلاعاتی پایه‌ریزی شده است و داده‌های منابع و روابط بین آن‌ها را تشریح می‌كند. پدیدآورندگان منابع، ناشران، كتابداران و سایر متخصصان اطلاع‌رسانی می‌توانند ابرداده را تولید كنند. ابرداده می‌تواند در درون منابع اطلاعاتی جاسازی(۳) و یا در كنار منبع اطلاعاتی و به طور مجزا حفظ شود. (Cleveland, ۲۰۰۱,P.۲۲۳)
قالب ابرداده‌ای دوبلین كور نمونه‌ای پیشنهادی از ابرداده است كه دستاورد نشست متخصصان اطلاع‌رسانی در دوبلین اوهایو به منظور حل مشكلات موجود در توصیف منابع اطلاعاتی موجود بر روی شبكه‌های كامپیوتری است. این نمونه‌ای از مفهوم پیوند بین ابرداده و وب است.شاخص‌های عنوان، پدیدآور، موضوع، ناشر، توصیف (همچون چكیده)، تاریخ ارائه، نوع مدرك، قالب(۴) (نیازهای سخت‌افزاری و نرم‌افزاری جهت ارائه مدرك)، برچسب منحصر به فرد شناسایی(۵)، محل تولید مدرك، زبان اصلی مدرك، چگونگی و محل ارتباط مدرك با سایر منابع، پوشش (بیانگر دامنه، محدوده و عمق مدرك) و مدیری حق موءلف، در قالب دوبلین كور پیشنهاد گردیده است. (Cleveland, ۲۰۰۱,P.۲۲۴)
شاخه‌های موضوعی
بعضی از ابزارهای جستجوی وب سعی در مرور سایت‌ها توسط افراد متخصص كرده و پس از تحلیل محتوی سایت، كلیدواژه مناسب را انتخاب و آن را در محل موضوعی، براساس لیست موضوعی ویژه خود قرار می‌دهند و در واقع یك راهنمای موضوعی را برای استفاده‌كننده فراهم می‌آورند. این در واقع به آن معناست است كه در زمانی كه موتور كاوش به طور معمول برای هدایت فرد به سایت، تمام صفحات آن سایت را نمایه كرده است، ولی از سوی دیگر یك راهنمای موضوعی بسیار شبیه یك پیوند به صفحه خانگی آن سایت تلقی می‌گردد. (Tyner, ۲۰۰۱).
سایت Open Directory و Looksmart دو نمونه بارز از این نوع سایت‌ها می‌باشند.
فن‌آوری موتورهای كاوش
ساختار متمركز
بسیاری از موتورهای كاوش از یك ساختار متمركز خزنده-نمایه‌ساز(۶) سود می‌جویند. خزنده‌ها برنامه‌های نرم‌افزاری هستند كه عمل پیمایش وب را انجام داده و صفحات جدید و یا به روز درآمده را به سرویس‌دهنده‌ای كه قرار است این صفحات در آنجا نمایه شوند، می‌فرستند. یك خزنده به عنوان نقطه شروع یك URL را دریافت كرده و انتقال صفحات وب را-همچون ایستگاه كاری كه صفحات را مرور می‌كند-به سرویس‌دهنده آغاز می‌نماید. پس از انتقال یك مدرك، سازه‌یاب(۷) شروع به استخراج واژه‌های مرتبط با متن كرده و آن‌ها را به پایگاه داده می‌افزاید. هر ركورد اطلاعاتی در این پایگاه شامل واژه استخراج شده و URL مربوط به آن می‌باشد. قابل ذكر است، تعدادی از خزنده‌ها واژه‌های موجود در بین برچسب‌هایی خاص نظیر، <TITLE>,<H۱>... و یا واژه‌های با بسامد بالا می‌نمایند.JumpstationII از این نوع است كه علاوه بر آن واژه‌های موجود در عناصر <HEADER> (<Hi>,۱<=I<=۶) و واژه‌های با بسامد بالا در برچسب <BODY> را استخراج می‌كند.خزنده WWWW واژه‌های موجود در عنصر URL, <TITLE> و <A> (ابر پیوندهای موجود در مدرك) را نمایه می‌كند.در حقیقت خزنده به درون رایانه نفوذ نمی‌كند، بلكه بر روی یك رایانه محلی اجرا شده و درخواست‌های خود را به رایانه‌های سرویس‌دهنده در نقاط مختلف ارسال می‌كند. عمل نمایه‌سازی در این روش به طور متمركز صورت می‌گیرد. شكل زیر ساختار نرم‌افزاری متمركز موتور كاوش AltaVista را نشان می‌دهد.اصلی‌ترین مشكل در این نوع ساختار، به دلیل طبیعت پویای وب، جمع‌آوری اطلاعات، پیوندهای ارتباطی اشباع شده به سرویس‌دهندگان وب و سربار شدن(۸) آن‌هاست. مشكل دیگر حجم اطلاعاتی است كه در حقیقت ساختار متمركز نمایه‌سازی توان مقابله با آن را ندارد. (Baeza-Yates, ۱۹۹۹, P.۳۷۴)
در واقع به دلیل درخواست‌های سریع ارسالی خزنده‌ها، و اشغال حجم قابل توجه‌ای از پهنای باند ارتباطی-و حتی تمام پهنای باند در حوزه‌های كوچك(۹)-و برای رفع این مشكل در ۳۰ ژوئن سال ۱۹۹۴ استانداردی را پدیدآوردگان برنامه‌های خزنده، برای محدودیت عمل برنامه‌های خودكار خزنده در سراسر وب به وجود آوردند. براساس این استاندارد، اگر ما می‌خواهیم خزنده‌ها از سرویس‌دهنده ما بازدید نكنند بایستی فایلی متنی با نام robots.txt بر روی ریشه(۱۰) سرویس‌دهندهء وب خود قرار دهیم و براساس توافقات پدیدآوردندگان خزندگان یا روبوت‌ها، این برنامه بایستی در اولین مرحله به دنبال این فایل در روی سرویس‌دهندهء وب جستجو كند و در صورت وجود به فرامین قرار داده شده در آن پاسخ داده و سپس به اعمال دیگر بپردازد.
البته با استفاده از ابربرچسب(۱۱) ROBOTS نیز می‌توان از نمایه شدن صفحهء وب توسط روبوت جلوگیری كرد. (Sullivan, ۲۰۰۰)
<HEAD>
<TITILE>Page I Don`t Want To Search Engines</TITLE>
<META NAME=”ROBOTS” CONTENT =”NOINDEX”>
</HEAD>
ساختار پراكنده
این نوع ساختار بسیار موءثرتر از نوع متمركز است و مشكلات ناشی از استفاده از ساختار متمركز چون:
۱) دریافت درخواست صفحات، توسط خزنده‌های گوناگون موتوهای كاوش، از سرویس‌دهندگان وب،
۲) افزایش ترافیك در وب به علت استخراج تمام اشیا و اجزا صفحات وب و نادیده گرفتن اكثر آن‌ها هنگام نمایه‌سازی؛
۳) جمع‌آوری اطلاعات بدون همكاری و آگاهی سایر خزنده‌ها و موتورهای كاوش، در این ساختار مورد توجه قرار گرفته و مرتفع شده است.برای رفع مشكلات ذكر شده، Harvest یكی از مهمترین مدل‌ها در این نوع دو عنصر اصلی را معرفی می‌كند: گردآورنده(۱۲) و واسط(۱۳). (Baeza-Yates, ۲۰۰۰, P.۳۷۵).گردآورنده یك نرم‌افزار خودكار است كه بر روی سرویس‌دهندهء وب اجرا می‌شود و عمل جمع‌آوری و استخراج اطلاعات لازم برای فایل نمایه را انجام می‌دهد. البته این نرم‌افزار بر روی سایر سرویس‌دهنده‌گان وب نیز می‌توان اجرا شود كه این خود با ساختار Haverst در تناقض است.واسط به استخراج اطلاعات از گردآورنده‌ها پرداخته و ضمن ایجاد یك نمایه قابل جستجو، واسط كاربری آن را نیز فراهم می‌كند. همان گونه كه دیده می‌شود، یك نرم‌افزار گردآورنده بر روی سرویس‌دهندهء وب، بدون هیچ ترافیك خارجی اجرا شده و اطلاعات جمع‌آوری شده به چندین واسط قابل ارسال می‌باشد. هر واسط می‌تواند بعد از فیلتر كردن اطلاعات آن را به سایر واسط‌ها ارسال كند.یكی از اهداف Harvest ایجاد واسط‌های ویژه موضوعی(۱۴) و اجتناب از حوزهء وسیع لغات و مشكلات نمایه‌های عمومی است.ساختار Harvest، تكراركننده‌ها و حافظه‌های نهانی اشیا(۱۵) را نیز جهت افزایش سرعت دسترسی به پایگاه داده‌ها فراهم می‌كند. امروزه برنامه‌های كاربردی این شیوه در مراكزی چون ناسا(۱۶) و آكادمی ملی علوم آمریكا مورد استفاده قرار می‌گیرد و نمونه مورد استفاده در بخش تجاری در وب، سرویس‌دهنده فهرست، شركت Netscape است.نمونه‌ای از ساختار Harvest در شكل زیر دیده می‌شود:
نتیجه‌گیری
افزونی افسار گسیخته اطلاعات بر روی شبكه وب، متخصصان رایانه و اطلاع‌رسانی را در جهت بهبودی كارائی نظام‌های نمایه‌سازی و به تبع آن بازیابی اطلاعات سوق می‌دهد.حركت از سوی نمایه‌های دست‌ساز تا نمایه‌های خودكار و ارائهء شیوه‌های گوناگون آن، به جهت سرعت بخشیدن برای ارائهء اطلاعات و رفع مشكلات فنی موجود بوده است. با وجود این علیرغم خوش‌بینی در مورد ابزارهای نمایه‌ساز و جستجوگر، هنوز هم بازیابی موضوعی در هر پایگاهی، بر اساس نمایه‌سازی كلیدواژه‌ای صورت می‌گیرد و جستجو براساس منطق بولی بوده و ریزش كاذب در آن قابل توجه است.اهداف آتی در این حوزه، مطالعه هر چه بیشتر پردازش اطلاعات توسط انسان و چگونگی فهم انسان از اطلاعات و رسیدن به نظام‌های هوشمند نمایه‌ساز و بازیاب، با استفاده از تجارب و نتایج امیدواركنندهء حوزه‌هایی نظیر هوش مصنوعی و نظام‌های خبره می‌باشد.
پی‌نوشت‌ها
۱. KeyWord In Context
۲. Metadata
۳. Embedded
۴. Format
۵. Identifier
۶. Crawler-indexer
۷. Parser
۸. High load
۹. Domain
۱۰. Root
۱۱. Meta Tag
۱۲. Gathere
۱۳. Broker
۱۴. Topic-specific
۱۵. Object Cache
۱۶. NASA
منابع
۱.American Society of Indexer. Main Page: http://www.asindexing.org
۲. Baeza-Yates, Ricardo;Ribeiro-Note, Berthier (۱۹۹۹). Modern Information Rerieval. NewYork: ACM Press
۳. Cleveland, Donald B.; Cleveland, Ana D. (۲۰۰۱). Introduction to Indexing and Abstracting. Englewood: Libraries Unlimited
۴. Distributed Indexing Systems for Organizing the Web:
http://eubdl.ugr.es/temp/serbydor/g۹/know۴_i.htm
۵. George Town University website: http://www.gerogertown.edu
۶. Netcraft. Main Page: http://www.netcraft.com
۷. Open Directory Homepage: http://www.dmoz.org
۸. Pastore, Michael (۲۰۰۰). The Web: More Than ۲ Billion Pages Strong
http://cyberatlas.internet.com/big_picture/traffic_patterns/article/۰,,۵۹۳۱_۴۱۳۶۹۱,۰۰.htm
۹. Sullivan, Danny (۲۰۰۰). How to use HTML Meta Tags.
http://searchenginewatch.com/webmasters/meta.html
۱۰. Toward the automation of a routine task: Using Spidrs to index the Web:
http://eubdl.ugr.es/temp/serbydor/g۹/know۲_i.htm
۱۱. Tyner, Ross(۲۰۰۱). Sink or Swim: Internet Search Tools & Techniques.
http://www.ouc.bc.ca/libr/connect۹۶/search.html

نوشته: احمد كمیجانی
دانشجوی كارشناسی ارشد اطلاع‌رسانی

وبگردی
تلگرام جایگزین داخلی ندارد / در پیام رسان داخلی در حال تکمیل پرونده احتمالی خود هستید !
تلگرام جایگزین داخلی ندارد / در پیام رسان داخلی در حال تکمیل پرونده احتمالی خود هستید ! - به فرض محال که اطلاعات مردم مورد سوءاستفاده کشورهای دیگر قرار بگیرد، برای‌شان پیامد امنیتی مستقیمی ندارد. بسیاری از کاربران ایرانی در تلگرام به دریافتن و فرستادن اخبار و طیفی از جوک‌ها (از سیاسی گرفته تا خانوادگی) می‌پردازند. این مسائل هم برای کشورهای دیگر اهمیتی ندارد (البته اگر از تحلیل محتوا و کاربردهای بعدی‌شان بگذریم) و نمی‌تواند پیامد مستقیمی برای کاربر ایرانی داشته باشد. اما همین اطلاعات چنانچه…
ماجرای انحصار عربستان بر روغن مایع ایران / تا 100 درصد پالم !
ماجرای انحصار عربستان بر روغن مایع ایران / تا 100 درصد پالم ! - روغن های نباتی را خوب بشناسید. سخنان یک تولید کننده سابق روغن نباتی.
آشغال‌سازها گرفتار خانم مدیر شدند
آشغال‌سازها گرفتار خانم مدیر شدند - رییس سازمان ملی استاندارد ایران مجددا با خودروسازان در ارتباط با رعایت استانداردهای ۸۵‌گانه خودرویی از ابتدای دی‌ماه سال جاری اتمام حجت کرد.
ایران نیاز به مردانی بزرگ و دانشمند دارد / چرا اینهمه انسانهای ...
ایران نیاز به مردانی بزرگ و دانشمند دارد / چرا اینهمه انسانهای ... - مرتضوی هیچ گاه قاضی و حقوق دان نبود و نباید کار قضایی انجام می‌داد. اما این ضعف ماست که چنین فردی در جایگاه بالایی قرار می‌گیرد. شگفتی من از قاضی مرتضوی و رفتار او نیست که چرا خودش را برای اجرای حکم خود به زندان معرفی نکرد. من رفتار او با زهرا کاظمی را دیده بودم.
معنی و مفهوم "به ما این دختر خوشگل‌ها رو نشون بده"؟
معنی و مفهوم "به ما این دختر خوشگل‌ها رو نشون بده"؟ - بعد از انقلاب، به واسطه تنیده شدن حکومت و دین بسیاری از پست‌ها و سمت‌های سیاسی با هاله‌ای رو به رو شد که اجازه نمی‌داد صاحب آن منصب مورد نقد قرار بگیرد....
حمله فیزیکی به بازیگر زن ایرانی در خیابان! / عکس
حمله فیزیکی به بازیگر زن ایرانی در خیابان! / عکس - بازیگر سریال "تعطیلات رویایی" از حمله افراد ناشناس به خود خبر داد. مریم معصومی، بازیگر سینما و تلویزیون مورد حمله افراد ناشناس قرار گرفت.
ارسطوی پایتخت با مونا فائض پور ازدواج کرد
ارسطوی پایتخت با مونا فائض پور ازدواج کرد - «احمد مهران فر» بازيگر نقش «ارسطو عامل» در سريال پايتخت ۵ در اینستاگرام خود از ازدواجش با «مونا فائض پور» خبر داد.
صحبت های جنجالی رییسی علیه روحانی
صحبت های جنجالی رییسی علیه روحانی - صحبت های جنجالی رییسی پیرامون استفاده روحانی از نام امام رضا در انتخابات
500 نفر محتوای نامه‌های پستی مردم را میخواندند و چک می‌کردند!
500 نفر محتوای نامه‌های پستی مردم را میخواندند و چک می‌کردند! - محمد غرضی می‌گوید: زمانی که به عنوان وزیر در وزارت حضور یافتم بیش از ۵۰۰ نفر را دیدم نامه‌هایی که از داخل به خارج و از خارج به داخل کشور ارسال می‌شدند را چک می‌کردند و به صورت سه شیفت فعالیت می‌کردند و نامه‌ها را می‌خواندند.
جنجال ویدیو دختر بازیگر روی کول بازیکن پرسپولیس!
جنجال ویدیو دختر بازیگر روی کول بازیکن پرسپولیس! - عکس و ویدیویی منتسب به ستاره پرسپولیس فرشاد احمدزاده و ترلان پروانه بازیگر سینما و تلویزیون در فضای مجازی منتشر شده است. عجب پاپراتزی‌هایی داریم!
خانم ایرانی، عامل تیراندازی در مقر یوتیوب / فیلم
خانم ایرانی، عامل تیراندازی در مقر یوتیوب / فیلم - ویدیوهایی از نسیم نجفی اقدم در شبکه های اجتماعی به زبان های انگلیسی و فارسی موجود است که در آن ها وی از حذف ویدیوهای خود توسط یوتیوب شکایت دارد.
رقص کاوه مدنی یا کالای ایرانی؟
رقص کاوه مدنی یا کالای ایرانی؟ - بگذارید اینطور بپرسم: مگر کیروش، مربی تیم ملی فوتبال جمهوری اسلامی ایران عرق نمی‌خورد؟ نمی‌رقصد؟ مگر برانکو و شفر نمازشب می‌خوانند و روزه می‌گیرند و اصولگرا و ارزشی و انقلابی هستند؟!