سه شنبه, ۹ بهمن, ۱۴۰۳ / 28 January, 2025
ماشین های مترجم از خیال تا واقعیت
مدتی پیش بود که اعلام شد آمار مراجعه به مترجم گوگل (Google Translate) از مرز ۲۰۰ میلیون کاربر در روز گذشته است. شاید برای شما که احتمالا جملهای به انگلیسی یا زبانی دیگر را در سایت مترجم گوگل وارد کردهاید و جملهای بیسروته و نامفهوم را به عنوان ترجمه دریافت نمودید، این رقم بسیار بالا شگفتانگیز باشد. دلیل این استقبال گسترده از این سرویس چیست؟ آیا کیفیت ترجمه بین زبانهای مختلف در آن متفاوت است؟ اصلا مترجم گوگل چگونه کار میکند؟ شاید پاسخ به این پرسشها بتواند به ما در استفاده بهتر از این سرویس گوگل یاری رساند.
● ترجمه بدون دخالت انسان
مترجم گوگل کار خود را سال ۱۳۸۰ و فقط با ۹ زبان آغاز کرد. این مترجم مبتنی بر نرمافزاری بود که توسط شرکت آی.بی.ام طراحی شده بود و در آن واژگان متن مبدا استخراج و در قالب دستوری خاصی به زبان مقصد ترجمه میشد. اما از پاییز ۱۳۸۶ کارشناسان گوگل به این نتیجه رسیدند که بهتر است از رویکردی دیگر برای ترجمه استفاده کنند. آنها به این نتیجه رسیدند که رویکرد استخراج داده (یعنی جستجو در میان محتوای متنی موجود در اینترنت برای ترجمه) بهترین شیوه برای کار است. در واقع مترجم گوگل اصلا کاری به معنای کلمات ندارد. وقتی جملهای را به مترجم گوگل میدهیم، این نرم افزار با بهرهگیری از توان بالای محاسباتی خود، در میان میلیونها متن مختلف ترجمه شده خود جستجو کرده تا بتواند جملهای مشابه جمله ما را بیابد. مترجم گوگل از یک بانک داده بسیار گسترده که شامل میلیونها متن ترجمه شده به زبانهای مختلف است بهره میبرد. این اسناد شامل تمام اسناد رسمی منتشر شده اتحادیه اروپا از از بدو تاسیس تاکنون به زبانهای مختلف این اتحادیه است. تمام اسنادی که سازمان ملل متحد به شش زبان رسمی خود (انگلیسی، فرانسوی، اسپانیایی، روسی، عربی و چینی) منتشر کرده نیز در این بانک داده جای دارند. تعداد بسیار زیادی از متون مختلف از جمله کتابها، مقالات و گزارشهای دو زبانهای که توسط موسسات آموزشی و پژوهشی و نیز افراد علاقهمند در اختیار گوگل قرار گرفته است از دیگر منابع مورد اتکای گوگل برای ترجمه است. در واقع ترجمه ارائه شده گوگل حاصل کار هزاران مترجمی است که پیش از آن، متونی را برای مقاصدی خاص ترجمه کرده بودند. گوگل در میان فایلهای متنی جستجو میکند تا الگویی مشابه الگوی جمله وارد شده ما بیابد. از آنجا که ممکن است چند متن مشابه در میان این بانک داده پیدا شود، مترجم گوگل از روشهای آماری برای تعیین بهترین ترجمه ممکن استفاده میکند.
مترجم گوگل ابتدا زبانهای رایجتر و پرگویشتر (همچون انگلیسی، فرانسوی، اسپانیایی و آلمانی) را در فهرست زبانهای خود داشت. اما کمکم بر تعداد زبانها افزوده شد. به طوری که تا امروز ۷۲ زبان در فهرست زبانهای قابل قبول مترجم گوگل قرار دارد.
در حال حاضر ترجمه انجام شده توسط مترجم گوگل میان زبانهای پرگویش (برای نمونه اسپانیایی به انگلیسی) از کیفیت قابل قبولی برخوردار است، زیرا انبوهی از متون ترجمه شده اسپانیایی به انگلیسی را در اختیار دارد. اما بیایید ترجمه بین دو زبان کمگویش (همچون ویتنامی به فارسی یا فارسی به اکراینی) را در نظر بگیرید. گوگل برای ترجمه از یک زبان به زبانی دیگر به متون دو زبانه خود مراجعه میکند تا جملاتی مشابه جمله وارد شده را بیابد. اما مگر چند سند متنی فارسی به ویتنامی در دنیا وجود دارد؟ یا چند رمان و داستان فارسی به ویتنامی ترجمه شده تا گوگل بخواهد از آن استفاده کند؟
● زبانهای واسطه
گوگل برای حل مشکل ترجمه در زبانهایی که برای آنها اسناد دو زبانه کافی وجود ندارد، سراغ زبانهای واسطه (intermediary languages) میرود. از آنجا که زبان رسمی گوگل انگلیسی است و اینکه برای هر زبانی، متون دو زبانه که یک طرف آن انگلیسی باشد بیشتر از سایر متون دو زبانه یافت میشود، از انگلیسی به عنوان «زبان واسطه» استفاده میشود. وقتی متنی به زبان ویتنامی را به مترجم گوگل میدهیم و میخواهیم آن را به فارسی ترجمه کند، گوگل ابتدا در میان اسناد ویتنامی به انگلیسی خود جستجو کرده و متن را به انگلیسی ترجمه میکند. در مرحله بعد این جستجو در میان اسناد انگلیسی به فارسی صورت گرفته و متن به زبان درخواستی یعنی فارسی ترجمه میشود. شاید بیسر و ته بودن بسیاری از جملات ترجمه شده از یک زبان به فارسی به همین دلیل است. از آنجا که هر زبان از ظرافتهای خاصی برخوردار است، ترجمه یک متن به زبان واسطه و سپس ترجمه آن به زبان مقصد باعث کاهش شدید دقت مورد نیاز میشود.
به طور کلی چون تعداد اسناد متنی دوزبانه گوگل، از زبانهای پرگویش به فارسی و برعکس نیز محدود است، شاهد هستیم این ترجمهها دقت و کیفیت پایینی دارند.
شاید بتوان تنها راه برای افزایش این دقت را در گسترش بانک داده گوگل جست. به همین دلیل است که گوگل این امکان را به کاربران خود میدهد تا متونی که توسط مترجم انسانی ترجمه شده را بر روی سرور این شرکت آپلود کند تا سرویس مترجم گوگل بتواند از آن برای ترجمههای بعدی خود بهره ببرد.
● آینده ترجمه ماشینی
زبان همواره یکی از پیچیدهترین پدیدههای بشری بوده است. یکی از ویژگیهای جالب زبان طبیعی انسان را باید در زنده بودن آن جست. زنده بودن یک زبان به این معناست که تحت تاثیر عوامل مختلف طی زمان به طور پیوسته دستخوش تغییراتی میگردد. تا همین چند دهه گذشته، بسیاری از دانشمندان بر این باور بودند که ترجمه ماشینی به هیچ وجه نمیتواند جایگزین ترجمه انسانی شود. اما تجربیات چند سال اخیر نشان میدهد با وجود فاصله کیفیت ترجمه ماشینی با ترجمه انسانی، کیفیت این نوع ترجمه بشدت افزایش یافته است. با اینکه هنوز تا نقطه ایدهآل در کیفیت ترجمه فاصله زیادی داریم، اما با روند فعلی پیشرفت ترجمه خودکار، شاید در آیندهای نه چندان دور شاهد جایگزینی آن به جای شکلهای سنتی ترجمه انسانی باشیم.
صالح سپهریفر
ایران مسعود پزشکیان دولت چهاردهم پزشکیان مجلس شورای اسلامی محمدرضا عارف دولت مجلس کابینه دولت چهاردهم اسماعیل هنیه کابینه پزشکیان محمدجواد ظریف
پیاده روی اربعین تهران عراق پلیس تصادف هواشناسی شهرداری تهران سرقت بازنشستگان قتل آموزش و پرورش دستگیری
ایران خودرو خودرو وام قیمت طلا قیمت دلار قیمت خودرو بانک مرکزی برق بازار خودرو بورس بازار سرمایه قیمت سکه
میراث فرهنگی میدان آزادی سینما رهبر انقلاب بیتا فرهی وزارت فرهنگ و ارشاد اسلامی سینمای ایران تلویزیون کتاب تئاتر موسیقی
وزارت علوم تحقیقات و فناوری آزمون
رژیم صهیونیستی غزه روسیه حماس آمریکا فلسطین جنگ غزه اوکراین حزب الله لبنان دونالد ترامپ طوفان الاقصی ترکیه
پرسپولیس فوتبال ذوب آهن لیگ برتر استقلال لیگ برتر ایران المپیک المپیک 2024 پاریس رئال مادرید لیگ برتر فوتبال ایران مهدی تاج باشگاه پرسپولیس
هوش مصنوعی فناوری سامسونگ ایلان ماسک گوگل تلگرام گوشی ستار هاشمی مریخ روزنامه
فشار خون آلزایمر رژیم غذایی مغز دیابت چاقی افسردگی سلامت پوست