یکشنبه ۲۹ بهمن ۱۳۹۶ / Sunday, 18 February, 2018

جست‌وجوی معنایی گامی در تحول موتورهای جست‌وجو


جست‌وجوی معنایی گامی در تحول موتورهای جست‌وجو
در دنیای مجازی امروز هر چند وقت یک بار، یک شرکت جدید با ایده جالبی برای کارآمدتر ساختن ابزار موتور جست‌وجو ظهور می‌کند؛ درست مانند گوگل که در اواخر دهه نود به یک باره ظاهر شد اکنون شرکت پاورست با اسلحه‌ی سری جست‌وجوی معنایی (سمانتیک) جدیدترین شرکتی است که به این عرصه پا گذاشته است.
ده سال پیش گوگل، شرکت کوچکی بود اما لری پیج و سرگی برین، بنیانگذاران ‌آن، ایده‌ی مربوط و مناسب کردن انبوه نتایج جست‌وجوی گیج کننده را در سر داشتند و تقریبا به نظر می‌رسید راهی را برای هوشمند‌تر کردن موتورهای جست‌وجو نسبت به یاهو، آلتاویستا و Excites آن زمان یافتند.
یک دهه‌ی بعد، این ایده یعنی جست‌وجوهای صفحه‌بندی شده مبتنی بر کلید واژه به استاندارد پذیرفته شده تبدیل شد و اگرچه ممکن است در نظر اول این گونه به نظر برسد اما موتورهای جست‌وجوی امروزی آنچه که واقعا بتوان هوشمند نامیدشان نیستند.
موتورهای جست‌وجوی امروزی هنوز مبتنی بر به اصطلاح روبات‌ها، برنامه‌های خودکاری که صفحات وب را اسکن کرده و کپی آن‌ها را در پایگاه داده‌ی عظیمی که ایندکس نامیده می‌شود، ذخیره می‌کنند، هستند.
الگوریتم استخراج اطلاعات به‌منظور ایجاد ارتباط میان صفحات وب و محاسبه‌ی رتبه‌بندی صفحات از طریق ایندکس کار می‌کند و از روش پیچیده‌ای برای اتصال این صفحات وب به واژه‌های جست‌وجو استفاده می‌کند و هرچه هوشمندتر باشد، تبلیغات مرتبط تری می‌تواند در یک صفحه نتایج جست‌وجو به نمایش درآید.
با وجود این حقیقت که گوگل ابزار جست‌وجو و بک‌اند ایندکس عظیم خود مانند ترکیب مجموعه‌ای از ایندکس‌های مختلف (متن، تصویر، نقشه، ویدیو و غیره) را بهبود می‌بخشد، به نظر می‌رسد سرعت نوآوری در فضای جست‌وجو متوقف شده است.
درست مانند ده سال قبل کاربران هنوز واژه‌های جست‌وجو را وارد کرده و با فهرستی از صفحات وب روبه‌رو می‌شوند.
البته باید قبول کرد کاربران نسبت به ده سال قبل اکنون آنچه را که در جست‌وجوی آن هستند در صفحه‌ی اول نتایج جست‌وجو می‌یابند اما با کاهش یافتن مربوط بودن نتایج، کاربران با انبوهی از اطلاعات بی‌ارزش روبه‌رو می‌شوند و به همین دلیل اغلب مجبورند جست‌وجوی خود را با اطلاعاتی از پایگاه‌های داده‌ی اینترنتی دیگر مانند ویکی پدیا کامل کنند.
اما در این میان پاورست ایده‌ی متفاوتی دارد؛ موتور جست‌وجوی این شرکت تنها هر صفحه آنلاین را ایندکس نمی‌کند بلکه سعی می‌کند محتوای خود را درک کند.
جست‌وجوی معنایی بخشی از یک ابتکار وب معنایی گسترده‌تر است که برخی از آن به عنوان وب ۳.۰ نام برده‌اند. در وب معنایی اطلاعات از منابع مختلف مرتبط شده و ارتباط با معنایی میان تکه‌های مختلف اطلاعات آنلاین ایجاد می‌شود.
هر اندازه که وب ۲.۰ مانند شبکه‌های اجتماعی به همکاری و اشتراک اطلاعات آنلاین معروف بوده و است، وب ۳.۰ واژه‌ای که این روزها بسیار مورد بحث است، معمولا به عنوان روش تبدیل وب به یک پایگاه داده عظیم و ایجاد درک در میان حجم وسیع اطلاعات آنلاین اطلاق می‌شود.
پاورست در مرحله آزمایشی اولیه بوده و قلمرو محدودی دارد زیرا ایندکس آن تنها شامل اطلاعات پایگاه داده ویکی پدیا و متاوب تکنولوژی است؛ این موتور جست‌وجو از این دو منبع برای ایجاد یک مجموعه حقایق مفید مرتبط با تقاضای جست‌وجو استفاده می‌کند.
پاورست به جای برخورد با صفحات به عنوان یک بخش از واژه‌های ایندکس شده بدون معنی، هر جمله را تجزیه کرده و معنی احتمالی آن را استخراج می‌کند. این روش نتایج جست‌وجوی موثرتر و هوشمندانه‌تر از آنچه موتورهای جست‌وجوی فعلی می‌توانند فراهم کنند به همراه دارد.
اگر چه برخی از تحلیلگران این صنعت پاورست را مورد تحسین قرار داده‌اند اما کارشناسان تردید دارند پاورست بتواند روابط خود را از ویکی‌پدیا و متاوب تکنولوژی به هزاران ارایه کننده‌ی محتوای اینترنتی گسترش دهد.
متقاعد کردن پدید آورندگان محتوا برای همکاری با پاورست و ارایه‌ی محتوای کپی‌رایت دارشان برای جست‌وجوی معنایی زمان و انرژی زیادی خواهد برد.
پاورست به عنوان یک شرکت تازه تاسیس سرمایه محدودی دارد و پول چیزی است که این شرکت به آن نیاز دارد؛ سرمایه‌گذاران فعلی این شرکت مدعی‌اند برای تامین رشد پاورست و گسترش فن‌آوری آن برای فهرست کردن ۲۰ میلیارد صفحه متعهد شده‌اند.
پاورست در نتایج جست وجو تبلیغات نشان نمی‌دهد و در حالی که تبلیغات بخشی از فعالیت این شرکت به عنوان منبع درآمد است اما برنامه‌ای برای استفاده از تبلیغات مبتنی بر کلید واژه‌های معمول ندارد و به جای آن این شرکت قصد دارد معنی تقاضاهای جست‌وجو را با تبلیغات نمایشی مربوط تطبیق دهد.
ناظران صنعتی این شرکت را تحت نظر قرار دارند زیرا فن‌آوری آن می‌تواند با وعده‌ی عرضه‌ی جست‌وجوی معنایی برتری گوگل را مورد تهدید قرار دهد.
جدیدترین آمار شرکت کام اسکار که بر اساس آن سهم گوگل در بازار جست‌وجوی اینترنتی از ۸/۵۹ درصد در ماه مارس به ۶/۶۱ درصد در ماه آوریل رسید، نشان می‌دهد گوگل متوقف شدنی نیست و یاهو و مایکروسافت همچنان با فاصله‌ی زیاد در پشت این غول اینترنتی قرار دارند.
تنها تفاوت مایکروسافت و یاهو با شرکت نوپایی مانند پاورست می‌تواند این باشد که در حالیکه این دو رقیب دیرین سعی می‌کنند از پشت سر به گوگل برسند، اگر پاورست به عنوان شرکت جوانی که دورنمای جدید و روش نوآورانه‌ای دارد بتواند محصول جست‌وجوی برتری عرضه کند که مورد علاقه‌ی کاربران باشد ممکن است فرصت بهتری برای تغییر قواعد بازی در این عرصه داشته باشد.


منبع : مدیا نیوز

مطالب مرتبط

رقابت «معنا‌»دار


رقابت «معنا‌»دار
مایکروسافت که چندی پیش تیرش برای تصاحب یاهو به سنگ خورد این بار برای ماندن در میدان رقابت با گوگل، چشم به موتور جست‌وجوی معنایی Powerset دوخته است.
Powerset، از این حیث توجه مایکروسافت را به خود جلب کرده که روش هوشمند‌تری را در زمینه جست‌وجوی وب طراحی کرده است. موتور جست‌وجوی این شرکت از فناوری «وب ‌معنایی» (Semantic Web) بهره می‌برد؛ به این معنا که نتایج جست‌وجو را براساس درک معنی کلمات یا محتوا ارایه می‌دهد. موتور‌های جست‌وجوی مهم دنیا هم‌اکنون برعکس این فناوری عمل می‌کنند یعنی تنها از طریق تطابق کلمات، جست‌وجوی صفحات وب را انجام می‌دهند.
بنا‌به این گزارش، مایکروسافت برای تصاحب این شرکت، مبلغ ۱۰۰ میلیون دلار پیشنهاد داده است و برخی از منابع آگاه اعلام کرده‌اند که این پیشنهاد‌ گویی به مذاق Powerset نیز خوش آمده، اما هنوز مذاکرات به مرحله قرارداد رسمی نرسیده است.
به عقیده بسیاری، اگر این قرارداد به نتیجه برسد، مایکروسافت گام بزرگی در مسیر رقابت با گوگل برداشته است. Powerset و موتور‌های جست‌وجوی معنایی دیگر – که در بسیاری از موارد بسیار بهتر از گوگل عمل می‌کنند- زمانی که کاربران جزییات دقیقی را در مورد موضوعات خاص نیاز دارند، اطلاعات و محتوا‌های مرتبط را به آنها ارایه داده و علاوه بر موضوعات مرتبط با کلید واژه، مطالب حقوقی مربوط به آن را نیز در اختیار کاربر قرار می‌دهند.
البته برای موتور جست‌وجویی همچون گوگل استفاده از فناوری جست‌وجوی معنایی چندان کار ساده‌ای نیست. موتور‌های جست‌وجوی مطرح نظیر گوگل و مایکروسافت بسیاری از صفحات وب را اسکن کرده و آنها را لیست و ایندکس می‌کنند.
در نتیجه سیستم‌های آنها روی چندین میلیون صفحه وب و براساس روش خاص، متمرکز شده و هر ساله نیز تعدادی از وب‌سایت‌های جدید به لیست آنها اضافه می‌شود.
اما این موتور‌های جست‌وجو برای استفاده از فناوری جست‌وجوی معنایی، باید از اساس تغییر کنند و دوباره تمامی وب‌سایت‌ها را براساس فناوری معنایی اسکن کرده و فهرست کنند که کار چندان ساده‌ای نیست.
● رو کردن برگ جدید
به‌کارگیری و توسعه فناوری جست‌وجوی معنایی کار بسیار دشواری است. اما گوگل دست به خطر زده و از چندی پیش، کارشناسان جست‌وجوی معنایی را به استخدام گرفته که یک دهه برای طراحی و ساخت این فناوری وقت گذاشته‌اند.آندریی هاگیو (Andrei Hagiu) ، استادیار دانشگاه هاروارد می‌گوید: تصاحب Powerset توسط مایکروسافت، یک گام درست و شاید بهترین برگ برنده‌ای بود که می‌توانست در مقابل گوگل رو کند.
مطمئنا مایکروسافت هم می‌تواند همانند گوگل، صفحات وب‌اش را دوباره اسکن کند. اما مایکروسافت می‌تواند تنها بخشی از ۴۶ میلیارد دلار قیمت یاهو را در زمینه تهیه تجهیزات ضروری نظیر سرور‌های مورد نیاز سرمایه‌گذاری کند.مایکروسافت همانند یک رقیب شکست خورده، تمایل دارد دست به ریسک بزند تا هر طور که شده با راه‌اندازی یک موتور جست‌وجوی جدید، رو در روی گوگل قد علم کند.
براساس گزارش شرکت تحقیقاتی Hitwise، گوگل ۷۰ درصد جست‌وجو‌های ماه مه گذشته را به خود اختصاص داده در حالی که فقط ۶ درصد از جست‌وجو‌های اینترنتی توسط مایکروسافت انجام شده است.
● چالش‌های استفاده از فناوری Powerset
با این وجود Powerset نوشدارو نیست. قدرت پردازش بالا و زمان بر بودن جست‌وجو‌های معنایی، موانع مهم استفاده از این فناوری محسوب می‌شود. این فناوری احتیاج به ریز‌پردازند‌ه‌ای دارد که بتواند در عرض ۲۰ ثانیه یک صفحه وب را آنالیز کند. بسیاری از سایت‌های کنونی، تنها یکی از زیر مجموعه‌های صفحه وب را می‌توانند اسکن کنند.
سیستم تشخیص یکی دیگر از موتور‌های جست‌وجوی معنایی، فقط صفحات مربوط به سلامت و حقوق را اسکن می‌کند. بنابراین می‌توان گفت که سال‌ها طول می‌کشد تا یک موتور جست‌وجوی معنایی، بتواند تمامی صفحات وب را اسکن کند و این یکی از مشکلات اساسی استفاده از این فناوری است.
یکی دیگر از موانع استفاده از این فناوری آن است که چندین موتور جست‌وجوی مشابه وجود دارند که همگی گوگل را نشانه گرفته‌اند. «هاکیا» یکی از این فناوری‌ها است که حدود ۲۱ میلیون دلار برای ساخت آن هزینه شده و می‌تواند تمامی صفحه را اسکن و لیست کند.
هاکیا امیدوار است که روزی بتواند با گوگل رقابت کند.
از سوی دیگر برخی از موتور‌های جست‌وجو نیز هستند که بدشان نمی‌آید توسط گوگل خریداری شوند.
بروکر آکر (Brooker Aker)، مدیر اجرایی Expert Syetem، شرکت سازنده موتور جست‌وجوی معنایی Cogito Focus معتقد است که وصلت با گوگل، سریع‌ترین‌ راه برای گسترش وب معنایی است.
وی می‌گوید: هیچ شرکتی سرور‌های قدرتمند گوگل را ندارد و همین عامل باعث می‌شود که راه این فناوری نیز به گوگل ختم شود.

شوخی، در لیست نیازهای زندگی
راننده‌ای که ماشین‌اش را همیشه و در هر شرایطی با یک دنده به حرکت درمی‌آورد و به حرکتش ادامه می‌دهد و یا در هر شرایطی، یکسان پایش را روی پدال گاز فشار می‌دهد، مطمئن باشد هم خودش …
وبگردی
بدل ایرانی آنجلینا جولی رونمایی شد !
بدل ایرانی آنجلینا جولی رونمایی شد ! - شب گذشته مراسم اکران فیلم بلوک 9 خروجی 2 به کارگردانی علیرضا امینی و تهیه کنندگی محمدرضا شریفی نیا و نیز فیلم شاخ کرگدن در پردیس سینمایی ملت برگزار گردید.
فیلم | سریع‌القلم: تقابل ما با جهان چقدر هزینه دارد؟
فیلم | سریع‌القلم: تقابل ما با جهان چقدر هزینه دارد؟ - اقتصاد سیاسی - محمودسریع القلم با بیان اینکه تقابل ما با جهان هزینه دارد،گفت:»هیچ انسانی پیدا نمی شود که بگوید با ظلم موافقم هستم،اما حکمرانی در کشور باید سود و زیان کند که با چه هزینه ای می خواهد این موضوع را پیش ببرد.»
سیف بعد از کاهش 30 درصدی ثروت مردم بجای استعفا وعده داد / عقب نشینی از کاهش دستوری نرخ سود
سیف بعد از کاهش 30 درصدی ثروت مردم بجای استعفا وعده داد / عقب نشینی از کاهش دستوری نرخ سود - تدابیر بانک مرکزی برای مدیریت بازار ارز؛ شامل انتشار اوراق گواهی سپرده ریالی، انتشار گواهی سپرده ریالی مبتنی بر ارز و طرح پیش فروش سکه بهارآزادی در نشست...
دولت ثبات و امید 4 سال پیش در مورد ارز چه گفت؟
دولت ثبات و امید 4 سال پیش در مورد ارز چه گفت؟ - یادآوری سخنی از رئیس جمهور،در برنامه تلویزیونی "دیدگاه"، پیش از انتخابات سال 1392 و نگاهی به نرخ ارز امروز ، 25 بهمن 1396
اظهارات جنجالی احمدی نژاد در مقابل دادگاه
اظهارات جنجالی احمدی نژاد در مقابل دادگاه - سخنرانی پرحاشیه احمدی نژاد در مقابل دادگاه بقایی
چه کسی به وقت شام را کمدی خطاب کرد؟!!
چه کسی به وقت شام را کمدی خطاب کرد؟!! - امیرقادری منتقد سینما: حاتمی کیا یک فیلم بد و کاریکاتوری ساخته است
تصاویر/ حاشیه و متن اختتامیه جشنواره فیلم فجر
تصاویر/ حاشیه و متن اختتامیه جشنواره فیلم فجر - آیین اختتامیه سی و ششمین جشنواره فیلم فجر در مرکز همایش‌های برج میلاد با حضور اسحاق جهانگیری معاون اول رییس جمهور و سید عباس صالحی وزیر ارشاد برپا شد.