گروه اعداد در ترجمه ماشینی

هدف از عرضه‌ گروه اعداد، ساختن تركیبات مجاز از اعداد اصلی و ترتیبی در زبان فارسی است. در این مقاله سی و هشت عضو دستگاه عددگویی فارسی در چهارگروه چندعضوی و دو گروه تك‌عضوی قرار داده شده‌اند. سی و هشت عضو مذكور در دو دسته قاعده‌ كلی (یعنی قواعد گروه اعداد اصلی و اعداد ترتیبی) جای داده شده‌اند. تعداد قواعد اعداد اصلی شامل چهل و هفت، و تعداد قواعد اعداد ترتیبی (كه خود بر دو نوع‌اند) شامل چهار قاعده است.

۱. مقدمه

ترجمه‌ ماشینی نوعی شبیه‌سازی از مغز انسان است و از این رو یكی از شاخه‌های هوش مصنوعی می‌باشد. اساس كار مترجم ماشینی، بر داده و خروجی است. مترجم ماشینی با قواعدی كه در اختیار دارد داده‌ها را پردازش می‌كند و خروجی مفروض را در اختیار كاربر می‌گذارد. جدا كردن حوزه‌های زبان و توصیف آن‌ها، مقدمه‌ ساختن قواعد است. قاعده‌ها باید دقیق و استثناناپذیر باشند. استفاده از معنا در ترجمه‌ ماشینی ضروری است، ولی قاعده‌ بعضی از بخش‌های زبان را می‌توان فارغ از معنا عرضه كرد. گروه اعداد، یكی از این بخش‌ها است كه می‌توان آن را بدون توسل به معنا، توصیف و قواعد آن را استخراج كرد. گروه اعداد، جزئی از گروه اسمی است كه در جایگاه وابسته‌های پیشین و پسین «اسم» قرار می‌گیرد.

۲. تلاش‌های اولیه برای ساختن مترجم ماشینی

از سال ۱۹۵۴ به بعد بود كه اصطلاح «ماشین ترجمه» به تدریج به كار رفت (Delavenay, ۱۹۷۲)، ولی عبارت «مترجم الكترونیكی» و «مترجم خودكار» را هم گاهی به كار می‌بردند. اما تلاش برای ساختن مترجم ماشینی از دهه‌ سی میلادی شروع شده بود. مترجم ماشینی را آن زمان وسیله‌ای ساده نظیر ماشین حساب می‌دانستند كه به راحتی زبانی را به زبان دیگر ترجمه می‌كند. این ساده‌انگاری اندك اندك جای خود را به واقع‌بینی داد. یكی از محققان پس از دو دهه تلاش، ترجمه‌ ماشینی را یكی از پیچیده‌ترین فعالیت‌هایی دانست كه بشر تا آن زمان به آن دست زده است(Dreyfus, & Dreyfus, ۱۹۸۹, p. ۵۶). نشانه‌ها در ماشین‌های عددی و الفبایی، تك معنا و شفاف هستند و ابهام و شرح و تفسیر در آن‌ها جایی ندارد و اجتماع نشانه‌ها نیز ارزش معنایی واحد و مطلقی دارند. در صورتی كه در ترجمه‌ زبان بشر، ابهام واژگانی[۱] و ابهام ساختاری[۲] از عمده مشكلات محققان هستند.

اولین مترجم ماشینی ساده و ابتدایی را یك محقق روسی در سال ۱۹۳۳ در مسكو ساخت و به ثبت رساند. در سال ۱۹۴۶ «بوت»[۳] و «ویور»[۴] به تحقیق درباره‌ ترجمه ماشینی پرداختند. «ویور» كار خود را براساس روش‌هایی كه با آن، پیام‌های دشمن را در جنگ جهانی دوم رمزشكنی می‌كردند قرار داده بود. «بوت» ماشینی ساخته بود كه كلمات زبان را به زبان دیگر ترجمه می‌كرد. در كار «بوت» نه به «نحو» پرداخته می‌شد نه به «ترتیب كلمات»[۵]. مترجم ماشینی «بوت» در اصل، كلمات مهم متن یا كلیدواژه‌ها[۶] را به زبانی دیگر ترجمه می‌كرد و فهم و تفسیر متن را به عهده كاربر وا می‌گذاشت.

«ریچنز»[۷] انگلیسی در سال ۱۹۴۸ فكر تجزیه‌ دستوری خودكار پایانه‌ كلمات[۸] را مطرح كرد كه نوعی ترجمه‌ كلمه به كلمه بود. «ویور» در سال ۱۹۴۹ ضمن تأیید كار «بوت» و «ریچنز» شباهت‌های زیرساختی زبان‌ها با یكدیگر را مطرح كرد؛ یعنی شباهت‌های معنایی و منطقی زبان‌ها كه مربوط به ویژگی‌های مغز انسان هستند و در همه‌ انسان‌ها مشترك‌اند. آنچه «ویور» در نهایت به كار «بوت» و «ریچنز» اضافه كرد پیشنهادهایی برای رفع ابهام معنایی بود.

در سال ۱۹۵۰ «ریفلر»[۹] نوعی ترجمه را كه انسان با كمك ماشین انجام می‌داد مطرح كرد. به عقیده‌ او باید ابتدا متن ترجمه می‌شد و سپس ماشین آن را ویرایش می‌كرد. یعنی به عبارتی، ترجمه‌ ماشینی باید یك پیش‌ویرایش[۱۰] و یك پس‌ویرایش[۱۱] می‌داشت و تعاملی[۱۲] می‌بود (Booth, ۱۹۶۷, p. ۵۳).

تحقیقات به صورتی گسترده ولی پراكنده ادامه داشت. «اسوالد»[۱۳] و «فلچر»[۱۴] در آلمان روی تجزیه‌ نحوی جملات كار می‌كردند. بنیاد «راكفلر» در سال ۱۹۵۲ در نخستین همایش هجده نفری زبان‌شناسان و متخصصان رایانه, سرمایه‌ قابل توجهی را برای ترجمه‌ ماشینی به «مؤسسه‌ فناوری ماساچوست» (ام‌آی‌تی) اهدا كرد. اعضای این همایش موافقت كردند كه تحقیقات در دو مرحله انجام شوند: مرحله‌ اول شامل تحقیق درباره‌ بسامد كلمات و شیوه‌ معادل‌یابی آن‌ها و چگونگی استفاده از حافظه‌ رایانه و دیگر جنبه‌های فنی فرهنگ لغت‌های ماشینی بود؛ مرحله‌ دوم مربوط به شیوه‌ تحلیل‌های نحوی می‌شد.

از سال ۱۹۵۲ تا ۱۹۵۵ محققان آمریكایی درباره‌ ظرفیت حافظه‌ رایانه و شناسایی خودكار معنای كلمات و شیوه‌ تحلیل پایانه‌های كلمات (پسوندها) تحقیق كردند. در سال ۱۹۵۴ «دوسترت»[۱۵] و «گاروین»[۱۶] در دانشگاه «جرج تاون» به موفقیت‌هایی در ترجمه‌ روسی به انگلیسی دست یافتند. آن‌ها با ۲۵۰ كلمه و ۶ قاعده، الگویی برای ترجمه‌ ماشینی عرضه كردند. در همان سال «ام‌آی‌تی» مجله‌ «ماشین ترجمه» را منتشر كرد.

در سال ۱۹۵۶ «ام‌آی‌تی» اولین نشست بین‌المللی ترجمه‌ ماشینی را با حضور متخصصان انگلیسی و كانادایی و آمریكایی و روسی برگزار كرد. در این زمان، آمریكا و انگلستان و شوروی محل اصلی تحقیقات ترجمه‌ ماشینی بودند، ولی در ایتالیا و كشورهای اسكاندیناوی هم تحقیقاتی انجام می‌شد. محققان در این سال‌ها دیگر تلاش نمی‌كردند كه ثابت كنند ترجمه‌ ماشینی كاری شدنی است، بلكه در حال نظم‌دادن و متمركز كردن پژوهش‌های پراكنده‌ای بودند كه در نقاط مختلف جهان انجام می‌شد.

در سال ۱۹۵۸ در آمریكا دوازده گروه در كار پژوهش‌های مربوط به ترجمه‌ ماشینی بودند: در دانشگاه هاروارد فرهنگ لغت ماشینی روسی به انگلیسی را می‌ساختند؛ «چامسكی» در «ام‌آی‌تی» درباره‌ ساخت‌های نحوی تحقیق می‌كرد؛ در دانشگاه «جرج تاون» درباره‌ نحو و معنا‌شناسی زبان روسی پژوهش‌هایی انجام می‌شد و در دانشگاه «میشیگان» تلاش می‌كردند تا قاعده‌های نحو روسی را استخراج، و مشكل چندمعنایی[۱۷] را حل كنند؛ ماشین ترجمه‌ای هم برای ترجمه‌ روسی به آلمانی در دانشگاه «سیاتل» در دست ساخت بود؛ در لس‌آنجلس و كالیفرنیا نیز محققان درباره‌ مسائل روش‌شناختی ترجمه‌ ماشینی تحقیق می‌كردند. در این بین به ترجمه‌ ماشینی زبان روسی به انگلیسی بیشتر اهمیت داده می‌شد.

در انگلستان بیش‌تر درباره‌ مسائل روش‌شناختی ترجمه‌ ماشینی، تحقیقات دقیقی انجام شد. یكی از مهم‌ترین كارهای پژوهشگران آن كشور، درباره‌ همكاری زبان‌شناسان و متخصصان رایانه بود. آنان تلاش بسیاری انجام دادند تا زبان‌شناسی، رشته‌ای از رشته‌های علوم دقیقه شود و در این راه از روش‌های ریاضی استفاده می‌كردند.

از دهه‌ پنجاه میلادی و با «چامسكی»، تحلیل‌های نحوی مستقل از معنا آغاز شده بود، ولی معناشناسی را «كتز» و «فودور» (۱۹۶۳) و «كتز» و «پستال» (۱۹۶۴) وارد كار ترجمه‌ ماشینی كردند. در مرحله‌ بعد نیز كاربردشناسی وارد حوزه‌ پردازش زبان شد.

انسان، دانشی از عالم خارج دارد كه آن را در تعبیر متن به كار می‌بندد: از این رو نظریه‌های گوناگونی درباره‌ شكل تجربه‌ انسان از عالم خارج، عرضه شد. یعنی متخصصان سعی كردند دانش عالم خارج را در حافظه‌ رایانه بگنجانند و عاقبت به این نتیجه رسیدند كه بهتر است دانش گسترده‌ عالم خارج را محدود كنند. به این سبب به جای ذخیره‌ كل دانش در حافظه‌ رایانه، موضوع عالم فرعی[۱۸] و نمایشنامه[۱۹] و فیلمنا‌مه[۲۰] مطرح شد كه همگی، شكل‌های مختلف ذخیره‌ دانش عالم خارج در رایانه هستند.

سیدمهدی سمایی

استادیار پژوهشگاه اطلاعات و مدارك علمی ایران

منابع

باطنی،‌ محمدرضا (۱۳۶۴). جمله، واحد ترجمه. در مجموعه مقالاتی پیرامون زبان و زبان‌شناسی (ص. ۷۲-۶۳). تهران: فرهنگ معاصر.

حسنیان، حسین (۱۳۶۸). گروه اسمی زبان فارسی برمبنای نظریه‌ ایكس تیره. مجله زبانشناسی، ۶(۱)، ۴۰-۲۹.

سمائی، سیدمهدی (۱۳۸۱). پردازش گروه اسمی. فصلنامه اطلاع‌رسانی، ۱۸(۱ و ۲)، ۴۱-۳۴.

صادقی، علی اشرف و ارژنگ، غلامرضا (۱۳۵۶). دستور سال دوم فرهنگ و ادب. تهران: انتشارات آموزش و پرورش.

مشكوهٔ‌الدینی، مهدی (۱۳۶۶). دستور زبان فارسی برپایه نظریه‌ گشتاری. مشهد: انتشارات دانشگاه فردوسی.

میلانیان، هرمز (۱۳۵۱). دستگاه عدد در زبان فارسی. به كوشش محمد روشن، سومین كنگره تحقیقات ایرانی: ج ۱. (ص. ۶۴۵-۶۳۱). تهران: بنیاد فرهنگ ایران.

Booth, K. H. V. (۱۹۶۷). Machine aided translation with a post-editor. In A. D. Booth (Ed.), Machine Translation (pp. ۵۳-۷۶). Amsterdam: North-Holland Publishing Company.

Delavenay, Emile (۱۹۷۲). La machine a traduire.Paris: PUF.

Dreyfus, H. L. & Dreyfus, S. E. (۱۹۸۹). Mind over machin. Oxford, UK: B. Blackwell.

Katz, J., & Fodor, J. (۱۹۶۳). The structure of a semantic theory. Language, ۳۹, ۱۷۰-۲۱۰.

Katz, J. J., & Postal, P. M. (۱۹۶۴). An integrated theory of linguistic descriptions. Cambridge: MIT press.

Mahmoudi, S. M. (۱۹۹۴). Contribution au traitement automatique de la langue persane. These de doctorat, Universite de Lyon II

Trask, R. L. (۱۹۹۳). A dictionnary of grammatical terms in linguistics. London: Routledge.

پی‌نوشت‌ها

[۱]. Lexical ambiguity

[۲]. Structural ambiguity

[۳]. Boot

[۴]. Weaver

[۵]. Word Order