سه شنبه, ۲ مرداد, ۱۴۰۳ / 23 July, 2024
مجله ویستا

بالاخره راهی برای پاسخ گرفتن از اینترنت


موفقیت موتور جست وجوی «گوگل» (Google) از توانایی خارق العاده آن در جدا كردن صفحات شبكه ای (وب پیج ها) مفید از صفحات اشغال بود اما جایزه اصلی مطمئناً به كسی داده خواهد شد كه بتواند از اینترنت برای به دست دادن پاسخی مستقیم به پرسشی مستقیم استفاده كند. و «اریك بیل» پژوهشگر میكروسافت می گوید اولین كسی خواهد بود كه این كار را انجام خواهد داد.
نخستین رخنه دكتر بریل در این مشكل، سیستمی است كه Ask MSR (از MSR بپرس) نامیده می شود (MSR مخفف Microsoft Research است). این برنامه از اطلاعات صفحات شبكه برای پاسخ دادن به پرسش هایی كه پاسخشان كلمه یا عبارتی منفرد است استفاده می كند برای مثال در برابر پرسش «مریلین مونرو كی متولد شد؟» ASK MSR این پرسش را به روش های گوناگون پردازش می كند. مثلاً با شناسایی كردن فعل، و سپس تغییر دادن زمان آن یا حركت دادن آن به جاهای مختلف جمله (مثلاً «مریلین شده مونرو متولد»، «مریلین مونرو متولد شد» و غیره) سپس عبارات حاصل به یك موتور جست وجو خورانده می شود و اسنادی كه حاوی زنجیره های كلمات مطابقت كننده هستند بازیابی می شوند. این روش استراتژی بی هدفی به نظر می رسد، اما عبارت های پرت و پلا كلمات مطابقت كننده بسیار كمی تولید می كنند، بنابراین همانطور كه دكتر بریل اظهار می كند «غلط بودن بسیار ارزان است.»
سپس توده اسناد جمع آوری شده از اینترنت برای یافتن پاسخ های احتمالی مورد بررسی اجمالی قرار می گیرند و این پاسخ ها بر حسب فراوانی ردیف می شوند. عملاً به پاسخ صحیح یكی از سه جایگاه اول حدود ۷۵درصد موارد ظاهر می شود. این میزان ممكن است خیلی خوب به نظر نرسد، اما هوش انسان فیلتری ثانوی را فراهم می كند، چرا كه پاسخ های اشتباه اغلب واضح هستند. برای مثال اگر شما بپرسید «بیورن بورگ» چند بار در مسابقات تنیس ویمبلدون برنده شد؟، «۱۹۸۰» پاسخی معقول نیست، اما «۵» پاسخی منطقی است، در صورت وجود تردید كلیك كردن روی پاسخی، فهرستی از پیوندها (لینك ها) را به صفحاتی فراهم می آورد كه اطلاعات لازم برای آن پاسخ را در اختیار می گذارد.
ASK MSR هنوز یك مدل ابتدایی است، گرچه میكروسافت در تلاش است تا آن را بهبود بخشد و ممكن است تحت نام Answer Bot به طور تجاری عرضه شود. در همین حال دكتر بریل به وظیفه ای سخت تر روی آورده است. عنوان یكی از مقالات اخیر او كه با همكاری رادو سوریكات از دانشگاه كالیفرنیای جنوبی نوشته شده، «فراسوی شبه فاكت ها» Beyond Factoids)) است. این مقاله تلاش های او برای ساختن سیستمی را شرح می دهد كه توانایی فراهم كردن پاسخ های ۵۰ كلمه ای را به پرسش هایی مانند اینها داشته باشد: «قواعد شركت در جوایز اسكار كدامند؟» این وظیفه سخت تر از یافتن پاسخی یك كلمه ای است، اما دكتر بریل معتقد است كه این كار با استفاده از چیزی كه مدل «كانال پرسروصدا» (Noisy (Channel Noisy) نامیده می شود باید امكان پذیر باشد. چنین مدل هایی از هم اكنون در سیستم های بررسی املای كلمات و شناسایی گفتار به كار می روند. آنها با مدل سازی تغییر شكل یابی بین آنچه منظور كاربر است (در بررسی املا كلمه ای كه قصد دارد تایپ كند) و آنچه او انجام می دهد (كلمه غلطی كه در واقع تایپ شده) عمل می كنند. درست همانطور كه خط تلفن صدای شخص را در انتهای دیگر خط تغییر می دهد، این فرایند را می توان به صورت «كانال پرسروصدایی» در نظر گرفت كه قصد كاربر را به صورت چیزی نسبتاً متفاوت تغییر شكل می دهد.
با تجزیه و تحلیل كردن بسیاری از جفت های صحیح و با املای نادرست با استفاده از فنون آماری پیش بینی كردن اینكه چنین تغییر شكل هایی در موارد عمومی چگونه عمل می كنند امكان پذیر است. آنگاه می توان سیستمی را طراحی كرد كه در جهت عكس این فرایند عمل كند.به عبارت دیگر با دادن یك كلمه با املای غلط، بتواند حدس بزند كه محتمل ترین كلمه ای كه این كلمه املای غلط آن است چیست.
سیستم پرسش _ پاسخ دهی دكتر بریل كاری شبیه به همین انجام می دهد. بسیاری از جفت های پرسش _ و _ پاسخ بر روی اینترنت، به صورت صفحات «سئوالات اغلب مورد پرسش» (FAQ) مربوط به موضوعات مختلف وجود دارند. دكتر بریل به سیستمش استفاده از یك میلیون از چنین جفت هایی را آموزش داد تا مدلی را خلق كند كه با داده شدن یك پرسش بتواند ساختارهای گوناگونی را كه پاسخ می تواند به خود بگیرد مورد بررسی قرار دهد. سپس این ساختارها برای تولید عبارات پرسش و اسناد مطابقت كننده ای بر روی اینترنت برای پیدا كردن چیزهایی كه شبیه پاسخ باشند بررسی می شوند.
این مدل ابتدایی فعلی پاسخ های متناسب را در حدود ۴۰ درصد موارد فراهم می كند. خیلی عالی نیست، اما خیلی بد هم نیست، و با رشد اینترنت باید انتظار بهبود آن را داشت. این روش سریع _ و _ پست (quick _and _dirty)، به جای تكیه بر رویكرد سنتی «هوش مصنوعی» یعنی تقطیع كردن جملات و تلاش برای پردازش معنای واقعی پرسش، بر خود هوش جمعی و همواره در حال رشد شبكه تكیه می كند.
Economist,Aug26th,2004
منبع : باشگاه اندیشه