سه شنبه, ۹ بهمن, ۱۴۰۳ / 28 January, 2025
مجله ویستا

ماشین های مترجم از خیال تا واقعیت


ماشین های مترجم از خیال تا واقعیت

مدتی پیش بود که اعلام شد آمار مراجعه به مترجم گوگل Google Translate از مرز ۲۰۰ میلیون کاربر در روز گذشته است شاید برای شما که احتمالا جمله ای به انگلیسی یا زبانی دیگر را در سایت مترجم گوگل وارد کرده اید و جمله ای بی سروته و نامفهوم را به عنوان ترجمه دریافت نمودید, این رقم بسیار بالا شگفت انگیز باشد دلیل این استقبال گسترده از این سرویس چیست

مدتی پیش بود که اعلام شد آمار مراجعه به مترجم گوگل (Google Translate) از مرز ۲۰۰ میلیون کاربر در روز گذشته است. شاید برای شما که احتمالا جمله‌ای به انگلیسی یا زبانی دیگر را در سایت مترجم گوگل وارد کرده‌اید و جمله‌ای بی‌سروته و نامفهوم را به عنوان ترجمه دریافت نمودید، این رقم بسیار بالا شگفت‌انگیز باشد. دلیل این استقبال گسترده از این سرویس چیست؟ آیا کیفیت ترجمه بین زبان‌های مختلف در آن متفاوت است؟ اصلا مترجم گوگل چگونه کار می‌کند؟ شاید پاسخ به این پرسش‌ها بتواند به ما در استفاده بهتر از این سرویس گوگل یاری رساند.

● ترجمه بدون دخالت انسان

مترجم گوگل کار خود را سال ۱۳۸۰ و فقط با ۹ زبان آغاز کرد. این مترجم مبتنی بر نرم‌افزاری بود که توسط شرکت آی.بی.ام طراحی شده بود و در آن واژگان متن مبدا استخراج و در قالب دستوری خاصی به زبان مقصد ترجمه می‌شد. اما از پاییز ۱۳۸۶ کارشناسان گوگل به این نتیجه رسیدند که بهتر است از رویکردی دیگر برای ترجمه استفاده کنند. آنها به این نتیجه رسیدند که رویکرد استخراج داده (یعنی جستجو در میان محتوای متنی موجود در اینترنت برای ترجمه) بهترین شیوه برای کار است. در واقع مترجم گوگل اصلا کاری به معنای کلمات ندارد. وقتی جمله‌ای را به مترجم گوگل می‌دهیم، این نرم افزار با بهره‌گیری از توان بالای محاسباتی خود، در میان میلیون‌ها متن مختلف ترجمه شده خود جستجو کرده تا بتواند جمله‌ای مشابه جمله ما را بیابد. مترجم گوگل از یک بانک داده بسیار گسترده که شامل میلیون‌ها متن ترجمه شده به زبان‌های مختلف است بهره می‌برد. این اسناد شامل تمام اسناد رسمی منتشر شده اتحادیه اروپا از از بدو تاسیس تاکنون به زبان‌های مختلف این اتحادیه است. تمام اسنادی که سازمان ملل متحد به شش زبان رسمی خود (انگلیسی، فرانسوی، اسپانیایی، روسی، عربی و چینی) منتشر کرده نیز در این بانک داده جای دارند. تعداد بسیار زیادی از متون مختلف از جمله کتاب‌ها، مقالات و گزارش‌های دو زبانه‌ای که توسط موسسات آموزشی و پژوهشی و نیز افراد علاقه‌مند در اختیار گوگل قرار گرفته است از دیگر منابع مورد اتکای گوگل برای ترجمه است. در واقع ترجمه ارائه شده گوگل حاصل کار هزاران مترجمی است که پیش از آن، متونی را برای مقاصدی خاص ترجمه کرده بودند. گوگل در میان فایل‌های متنی جستجو می‌کند تا الگویی مشابه الگوی جمله وارد شده ما بیابد. از آنجا که ممکن است چند متن مشابه در میان این بانک داده پیدا شود، مترجم گوگل از روش‌های آماری برای تعیین بهترین ترجمه ممکن استفاده می‌کند.

مترجم گوگل ابتدا زبان‌های رایج‌تر و پرگویش‌تر (همچون انگلیسی، فرانسوی، اسپانیایی و آلمانی) را در فهرست زبان‌های خود داشت. اما کم‌کم بر تعداد زبان‌ها افزوده شد. به طوری که تا امروز ۷۲ زبان در فهرست زبان‌های قابل قبول مترجم گوگل قرار دارد.

در حال حاضر ترجمه انجام شده توسط مترجم گوگل میان زبان‌های پرگویش (برای نمونه اسپانیایی به انگلیسی) از کیفیت قابل قبولی برخوردار است، زیرا انبوهی از متون ترجمه شده اسپانیایی به انگلیسی را در اختیار دارد. اما بیایید ترجمه بین دو زبان کم‌گویش (همچون ویتنامی به فارسی یا فارسی به اکراینی) را در نظر بگیرید. گوگل برای ترجمه از یک زبان به زبانی دیگر به متون دو زبانه خود مراجعه می‌کند تا جملاتی مشابه جمله وارد شده را بیابد. اما مگر چند سند متنی فارسی به ویتنامی در دنیا وجود دارد؟ یا چند رمان و داستان فارسی به ویتنامی ترجمه شده تا گوگل بخواهد از آن استفاده کند؟

● زبان‌های واسطه

گوگل برای حل مشکل ترجمه در زبان‌هایی که برای آنها اسناد دو زبانه کافی وجود ندارد، سراغ زبان‌های واسطه (intermediary languages) می‌رود. از آنجا که زبان رسمی گوگل انگلیسی است و این‌که برای هر زبانی، متون دو زبانه که یک طرف آن انگلیسی باشد بیشتر از سایر متون دو زبانه یافت می‌شود، از انگلیسی به عنوان «زبان واسطه» استفاده می‌شود. وقتی متنی به زبان ویتنامی را به مترجم گوگل می‌دهیم و می‌خواهیم آن را به فارسی ترجمه کند، گوگل ابتدا در میان اسناد ویتنامی به انگلیسی خود جستجو کرده و متن را به انگلیسی ترجمه می‌کند. در مرحله بعد این جستجو در میان اسناد انگلیسی به فارسی صورت گرفته و متن به زبان درخواستی یعنی فارسی ترجمه می‌شود. شاید بی‌سر و ته بودن بسیاری از جملات ترجمه شده از یک زبان به فارسی به همین دلیل است. از آنجا که هر زبان از ظرافت‌های خاصی برخوردار است، ترجمه یک متن به زبان واسطه و سپس ترجمه آن به زبان مقصد باعث کاهش شدید دقت مورد نیاز می‌شود.

به طور کلی چون تعداد اسناد متنی دوزبانه گوگل، از زبان‌های پرگویش‌ به فارسی و برعکس نیز محدود است، شاهد هستیم این ترجمه‌ها دقت و کیفیت پایینی دارند.

شاید بتوان تنها راه برای افزایش این دقت را در گسترش بانک داده گوگل جست. به همین دلیل است که گوگل این امکان را به کاربران خود می‌دهد تا متونی که توسط مترجم انسانی ترجمه شده را بر روی سرور این شرکت آپلود کند تا سرویس مترجم گوگل بتواند از آن برای ترجمه‌های بعدی خود بهره ببرد.

● آینده ترجمه ماشینی

زبان همواره یکی از پیچیده‌ترین پدیده‌های بشری بوده است. یکی از ویژگی‌های جالب زبان طبیعی انسان را باید در زنده بودن آن جست. زنده بودن یک زبان به این معناست که تحت تاثیر عوامل مختلف طی زمان به طور پیوسته دستخوش تغییراتی می‌گردد. تا همین چند دهه گذشته، بسیاری از دانشمندان بر این باور بودند که ترجمه ماشینی به هیچ وجه نمی‌تواند جایگزین ترجمه انسانی شود. اما تجربیات چند سال اخیر نشان می‌دهد با وجود فاصله کیفیت ترجمه ماشینی با ترجمه انسانی، کیفیت این نوع ترجمه بشدت افزایش یافته است. با این‌که هنوز تا نقطه ایده‌آل در کیفیت ترجمه فاصله زیادی داریم، اما با روند فعلی پیشرفت ترجمه خودکار، شاید در آینده‌ای نه چندان دور شاهد جایگزینی آن به جای شکل‌های سنتی ترجمه انسانی باشیم.

صالح سپهری‌فر