خبرگزاری همشهری‌آنلاین / ۱۴۰۴/۱۲/۰۴

آپارتاید الگوریتمی | هوش مصنوعی واقعا به کاربران ایرانی پاسخ غلط می دهد؟

دنیای مدرن مدعی است که هوش مصنوعی «دمکراتیک کردن دانش» است، اما واقعیت برای کاربران ایرانی چیز دیگری است. پشت ویترین پر زرق‌وبرق مدل‌های زبانی، یک تبعیض ساختاری پنهان شده است.

به گزارش همشهری آنلاین: گزارش‌های سال ۲۰۲۶ دانشگاه MIT نشان می‌دهد که کاربران فارسی‌زبان عملاً با نسخه‌ای ضعیف‌تر از هوش مصنوعی روبه‌رو هستند. گویی الگوریتم‌ها یاد گرفته‌اند که براساس جغرافیا، پاسخ دهند. پژوهش‌های انجام شده در اوایل سال ۲۰۲۶، تأیید می‌کنند که مدل‌های بزرگ زبانی (LLM) مانند محصولات OpenAI و گوگل، در مواجهه با کاربران ایرانی و زبان فارسی، عملکرد ضعیف‌تری نسبت به همتایان انگلیسی‌زبان خود دارند. اما چرا هوش مصنوعی با ایرانی‌ها «نامهربان» است؟

تبعیض در کد؛ شکافی که تصادفی نیست

چرا یک دانش‌آموز در نیویورک به دقیق‌ترین تحلیل‌های علمی دسترسی دارد، اما همان مدل برای دانش‌آموز ایرانی جملات متناقض و بی‌معنی ردیف می‌کند؟ کارشناسان معتقدند این صرفاً یک نقص فنی نیست، بلکه نتیجه «تنبلی الگوریتمی» شرکت‌هایی است که میلیاردها دلار صرف بهینه‌سازی زبان انگلیسی می‌کنند، اما زبان فارسی را در حاشیه رها کرده‌اند. این یعنی ما با یک «آپارتاید دیجیتال» روبه‌رو هستیم که در آن کیفیت خدمات براساس مرزهای جغرافیایی و سیاسی تعیین می‌شود.

زندانی در حصار زبان‌های کم‌منبع

هوش مصنوعی فعلی، فارسی را «فکر» نمی‌کند، بلکه آن را «ترجمه» می‌کند. زبان فارسی در دنیای داده‌ها، یک زبان Low-Resource یا «کم‌منبع» محسوب می‌شود. از آنجایی که بیش از ۹۰ درصد داده‌های آموزشی هوش مصنوعی را متون انگلیسی تشکیل می‌دهند، درک مدل از ظرافت‌های دستوری، ضرب‌المثل‌ها و اصطلاحات تخصصی فارسی بسیار محدود است. در واقع، هوش مصنوعی اغلب سؤالات فارسی را در لایه‌های زیرین خود به انگلیسی ترجمه کرده و پس از یافتن پاسخ، دوباره آن را به فارسی برمی‌گرداند؛ فرایندی که باعث می‌شود دقت پاسخ در حوزه‌های علمی و منطقی تا ۳۰ درصد کاهش یابد.

شکاف فرهنگی و سوگیری داده‌ها

ابزارهای هوش مصنوعی صرفاً یک ماشین محاسباتی نیستند، بلکه آینه‌ای از داده‌هایی است که به آن خورانده شده است. بخش بزرگی از محتوای فارسی موجود در وب که برای آموزش این مدل‌ها استفاده شده، یا توسط ترجمه‌های ماشینی ضعیف تولید شده‌اند یا حاوی اطلاعاتی هستند که با واقعیت‌های زیسته در ایران فاصله دارند. این موضوع باعث می‌شود در مسائل اجتماعی، حقوقی و حتی توصیه‌های سبک زندگی، پاسخ‌های هوش مصنوعی برای یک کاربر ایرانی «غیربومی» و گاهی «بی‌ربط» به‌نظر برسد.

بیشتر بخوانید:

فریدام آمریکایی | آزادی اینترنت ایران یا تله اطلاعاتی؟

نابرابری در دسترسی و زیرساخت

کارشناسان معتقدند بخشی از این پاسخ‌های ضعیف به‌دلیل محدودیت‌های دسترسی (تحریم‌ها و فیلترینگ) است. وقتی کاربر ایرانی مجبور است با ابزارهای تغییر آی‌پی و از طریق واسطه‌ها به این سرویس‌ها متصل شود، گاهی به‌دلیل اختلال در تبادل داده یا استفاده از نسخه‌های قدیمی‌تر و رایگان، کیفیت نهایی پاسخ‌ها افت می‌کند. در مقابل، یک کاربر در کالیفرنیا با دسترسی مستقیم به آخرین نسخه‌های بهینه‌شده، تجربه کاملاً متفاوتی دارد.

توهم

در پژوهش دانشگاه‌ام‌ای تی اشاره شده است که مدل‌های هوش مصنوعی در پاسخ به کاربرانی که از ساختارهای زبانی غیرانگلیسی استفاده می‌کنند، بیشتر دچار «توهم» (Hallucination) می‌شوند؛ یعنی با اطمینان کامل، اطلاعات غلط ارائه می‌دهند. این تحقیق هشدار می‌دهد که این «شکاف دیجیتال نوین» می‌تواند باعث عقب ماندن نخبگان و دانش‌آموزان کشورهای در حال توسعه در رقابت جهانی هوش مصنوعی شود.