
به گزارش همشهری آنلاین: گزارشهای سال ۲۰۲۶ دانشگاه MIT نشان میدهد که کاربران فارسیزبان عملاً با نسخهای ضعیفتر از هوش مصنوعی روبهرو هستند. گویی الگوریتمها یاد گرفتهاند که براساس جغرافیا، پاسخ دهند. پژوهشهای انجام شده در اوایل سال ۲۰۲۶، تأیید میکنند که مدلهای بزرگ زبانی (LLM) مانند محصولات OpenAI و گوگل، در مواجهه با کاربران ایرانی و زبان فارسی، عملکرد ضعیفتری نسبت به همتایان انگلیسیزبان خود دارند. اما چرا هوش مصنوعی با ایرانیها «نامهربان» است؟
چرا یک دانشآموز در نیویورک به دقیقترین تحلیلهای علمی دسترسی دارد، اما همان مدل برای دانشآموز ایرانی جملات متناقض و بیمعنی ردیف میکند؟ کارشناسان معتقدند این صرفاً یک نقص فنی نیست، بلکه نتیجه «تنبلی الگوریتمی» شرکتهایی است که میلیاردها دلار صرف بهینهسازی زبان انگلیسی میکنند، اما زبان فارسی را در حاشیه رها کردهاند. این یعنی ما با یک «آپارتاید دیجیتال» روبهرو هستیم که در آن کیفیت خدمات براساس مرزهای جغرافیایی و سیاسی تعیین میشود.
هوش مصنوعی فعلی، فارسی را «فکر» نمیکند، بلکه آن را «ترجمه» میکند. زبان فارسی در دنیای دادهها، یک زبان Low-Resource یا «کممنبع» محسوب میشود. از آنجایی که بیش از ۹۰ درصد دادههای آموزشی هوش مصنوعی را متون انگلیسی تشکیل میدهند، درک مدل از ظرافتهای دستوری، ضربالمثلها و اصطلاحات تخصصی فارسی بسیار محدود است. در واقع، هوش مصنوعی اغلب سؤالات فارسی را در لایههای زیرین خود به انگلیسی ترجمه کرده و پس از یافتن پاسخ، دوباره آن را به فارسی برمیگرداند؛ فرایندی که باعث میشود دقت پاسخ در حوزههای علمی و منطقی تا ۳۰ درصد کاهش یابد.
ابزارهای هوش مصنوعی صرفاً یک ماشین محاسباتی نیستند، بلکه آینهای از دادههایی است که به آن خورانده شده است. بخش بزرگی از محتوای فارسی موجود در وب که برای آموزش این مدلها استفاده شده، یا توسط ترجمههای ماشینی ضعیف تولید شدهاند یا حاوی اطلاعاتی هستند که با واقعیتهای زیسته در ایران فاصله دارند. این موضوع باعث میشود در مسائل اجتماعی، حقوقی و حتی توصیههای سبک زندگی، پاسخهای هوش مصنوعی برای یک کاربر ایرانی «غیربومی» و گاهی «بیربط» بهنظر برسد.
بیشتر بخوانید:
کارشناسان معتقدند بخشی از این پاسخهای ضعیف بهدلیل محدودیتهای دسترسی (تحریمها و فیلترینگ) است. وقتی کاربر ایرانی مجبور است با ابزارهای تغییر آیپی و از طریق واسطهها به این سرویسها متصل شود، گاهی بهدلیل اختلال در تبادل داده یا استفاده از نسخههای قدیمیتر و رایگان، کیفیت نهایی پاسخها افت میکند. در مقابل، یک کاربر در کالیفرنیا با دسترسی مستقیم به آخرین نسخههای بهینهشده، تجربه کاملاً متفاوتی دارد.
در پژوهش دانشگاهامای تی اشاره شده است که مدلهای هوش مصنوعی در پاسخ به کاربرانی که از ساختارهای زبانی غیرانگلیسی استفاده میکنند، بیشتر دچار «توهم» (Hallucination) میشوند؛ یعنی با اطمینان کامل، اطلاعات غلط ارائه میدهند. این تحقیق هشدار میدهد که این «شکاف دیجیتال نوین» میتواند باعث عقب ماندن نخبگان و دانشآموزان کشورهای در حال توسعه در رقابت جهانی هوش مصنوعی شود.

















































