سه شنبه, ۲ بهمن, ۱۴۰۳ / 21 January, 2025
گروه اعداد در ترجمه ماشینی
هدف از عرضه گروه اعداد، ساختن تركیبات مجاز از اعداد اصلی و ترتیبی در زبان فارسی است. در این مقاله سی و هشت عضو دستگاه عددگویی فارسی در چهارگروه چندعضوی و دو گروه تكعضوی قرار داده شدهاند. سی و هشت عضو مذكور در دو دسته قاعده كلی (یعنی قواعد گروه اعداد اصلی و اعداد ترتیبی) جای داده شدهاند. تعداد قواعد اعداد اصلی شامل چهل و هفت، و تعداد قواعد اعداد ترتیبی (كه خود بر دو نوعاند) شامل چهار قاعده است.
۱. مقدمه
ترجمه ماشینی نوعی شبیهسازی از مغز انسان است و از این رو یكی از شاخههای هوش مصنوعی میباشد. اساس كار مترجم ماشینی، بر داده و خروجی است. مترجم ماشینی با قواعدی كه در اختیار دارد دادهها را پردازش میكند و خروجی مفروض را در اختیار كاربر میگذارد. جدا كردن حوزههای زبان و توصیف آنها، مقدمه ساختن قواعد است. قاعدهها باید دقیق و استثناناپذیر باشند. استفاده از معنا در ترجمه ماشینی ضروری است، ولی قاعده بعضی از بخشهای زبان را میتوان فارغ از معنا عرضه كرد. گروه اعداد، یكی از این بخشها است كه میتوان آن را بدون توسل به معنا، توصیف و قواعد آن را استخراج كرد. گروه اعداد، جزئی از گروه اسمی است كه در جایگاه وابستههای پیشین و پسین «اسم» قرار میگیرد.
۲. تلاشهای اولیه برای ساختن مترجم ماشینی
از سال ۱۹۵۴ به بعد بود كه اصطلاح «ماشین ترجمه» به تدریج به كار رفت (Delavenay, ۱۹۷۲)، ولی عبارت «مترجم الكترونیكی» و «مترجم خودكار» را هم گاهی به كار میبردند. اما تلاش برای ساختن مترجم ماشینی از دهه سی میلادی شروع شده بود. مترجم ماشینی را آن زمان وسیلهای ساده نظیر ماشین حساب میدانستند كه به راحتی زبانی را به زبان دیگر ترجمه میكند. این سادهانگاری اندك اندك جای خود را به واقعبینی داد. یكی از محققان پس از دو دهه تلاش، ترجمه ماشینی را یكی از پیچیدهترین فعالیتهایی دانست كه بشر تا آن زمان به آن دست زده است(Dreyfus, & Dreyfus, ۱۹۸۹, p. ۵۶). نشانهها در ماشینهای عددی و الفبایی، تك معنا و شفاف هستند و ابهام و شرح و تفسیر در آنها جایی ندارد و اجتماع نشانهها نیز ارزش معنایی واحد و مطلقی دارند. در صورتی كه در ترجمه زبان بشر، ابهام واژگانی[۱] و ابهام ساختاری[۲] از عمده مشكلات محققان هستند.
اولین مترجم ماشینی ساده و ابتدایی را یك محقق روسی در سال ۱۹۳۳ در مسكو ساخت و به ثبت رساند. در سال ۱۹۴۶ «بوت»[۳] و «ویور»[۴] به تحقیق درباره ترجمه ماشینی پرداختند. «ویور» كار خود را براساس روشهایی كه با آن، پیامهای دشمن را در جنگ جهانی دوم رمزشكنی میكردند قرار داده بود. «بوت» ماشینی ساخته بود كه كلمات زبان را به زبان دیگر ترجمه میكرد. در كار «بوت» نه به «نحو» پرداخته میشد نه به «ترتیب كلمات»[۵]. مترجم ماشینی «بوت» در اصل، كلمات مهم متن یا كلیدواژهها[۶] را به زبانی دیگر ترجمه میكرد و فهم و تفسیر متن را به عهده كاربر وا میگذاشت.
«ریچنز»[۷] انگلیسی در سال ۱۹۴۸ فكر تجزیه دستوری خودكار پایانه كلمات[۸] را مطرح كرد كه نوعی ترجمه كلمه به كلمه بود. «ویور» در سال ۱۹۴۹ ضمن تأیید كار «بوت» و «ریچنز» شباهتهای زیرساختی زبانها با یكدیگر را مطرح كرد؛ یعنی شباهتهای معنایی و منطقی زبانها كه مربوط به ویژگیهای مغز انسان هستند و در همه انسانها مشتركاند. آنچه «ویور» در نهایت به كار «بوت» و «ریچنز» اضافه كرد پیشنهادهایی برای رفع ابهام معنایی بود.
در سال ۱۹۵۰ «ریفلر»[۹] نوعی ترجمه را كه انسان با كمك ماشین انجام میداد مطرح كرد. به عقیده او باید ابتدا متن ترجمه میشد و سپس ماشین آن را ویرایش میكرد. یعنی به عبارتی، ترجمه ماشینی باید یك پیشویرایش[۱۰] و یك پسویرایش[۱۱] میداشت و تعاملی[۱۲] میبود (Booth, ۱۹۶۷, p. ۵۳).
تحقیقات به صورتی گسترده ولی پراكنده ادامه داشت. «اسوالد»[۱۳] و «فلچر»[۱۴] در آلمان روی تجزیه نحوی جملات كار میكردند. بنیاد «راكفلر» در سال ۱۹۵۲ در نخستین همایش هجده نفری زبانشناسان و متخصصان رایانه, سرمایه قابل توجهی را برای ترجمه ماشینی به «مؤسسه فناوری ماساچوست» (امآیتی) اهدا كرد. اعضای این همایش موافقت كردند كه تحقیقات در دو مرحله انجام شوند: مرحله اول شامل تحقیق درباره بسامد كلمات و شیوه معادلیابی آنها و چگونگی استفاده از حافظه رایانه و دیگر جنبههای فنی فرهنگ لغتهای ماشینی بود؛ مرحله دوم مربوط به شیوه تحلیلهای نحوی میشد.
از سال ۱۹۵۲ تا ۱۹۵۵ محققان آمریكایی درباره ظرفیت حافظه رایانه و شناسایی خودكار معنای كلمات و شیوه تحلیل پایانههای كلمات (پسوندها) تحقیق كردند. در سال ۱۹۵۴ «دوسترت»[۱۵] و «گاروین»[۱۶] در دانشگاه «جرج تاون» به موفقیتهایی در ترجمه روسی به انگلیسی دست یافتند. آنها با ۲۵۰ كلمه و ۶ قاعده، الگویی برای ترجمه ماشینی عرضه كردند. در همان سال «امآیتی» مجله «ماشین ترجمه» را منتشر كرد.
در سال ۱۹۵۶ «امآیتی» اولین نشست بینالمللی ترجمه ماشینی را با حضور متخصصان انگلیسی و كانادایی و آمریكایی و روسی برگزار كرد. در این زمان، آمریكا و انگلستان و شوروی محل اصلی تحقیقات ترجمه ماشینی بودند، ولی در ایتالیا و كشورهای اسكاندیناوی هم تحقیقاتی انجام میشد. محققان در این سالها دیگر تلاش نمیكردند كه ثابت كنند ترجمه ماشینی كاری شدنی است، بلكه در حال نظمدادن و متمركز كردن پژوهشهای پراكندهای بودند كه در نقاط مختلف جهان انجام میشد.
در سال ۱۹۵۸ در آمریكا دوازده گروه در كار پژوهشهای مربوط به ترجمه ماشینی بودند: در دانشگاه هاروارد فرهنگ لغت ماشینی روسی به انگلیسی را میساختند؛ «چامسكی» در «امآیتی» درباره ساختهای نحوی تحقیق میكرد؛ در دانشگاه «جرج تاون» درباره نحو و معناشناسی زبان روسی پژوهشهایی انجام میشد و در دانشگاه «میشیگان» تلاش میكردند تا قاعدههای نحو روسی را استخراج، و مشكل چندمعنایی[۱۷] را حل كنند؛ ماشین ترجمهای هم برای ترجمه روسی به آلمانی در دانشگاه «سیاتل» در دست ساخت بود؛ در لسآنجلس و كالیفرنیا نیز محققان درباره مسائل روششناختی ترجمه ماشینی تحقیق میكردند. در این بین به ترجمه ماشینی زبان روسی به انگلیسی بیشتر اهمیت داده میشد.
در انگلستان بیشتر درباره مسائل روششناختی ترجمه ماشینی، تحقیقات دقیقی انجام شد. یكی از مهمترین كارهای پژوهشگران آن كشور، درباره همكاری زبانشناسان و متخصصان رایانه بود. آنان تلاش بسیاری انجام دادند تا زبانشناسی، رشتهای از رشتههای علوم دقیقه شود و در این راه از روشهای ریاضی استفاده میكردند.
از دهه پنجاه میلادی و با «چامسكی»، تحلیلهای نحوی مستقل از معنا آغاز شده بود، ولی معناشناسی را «كتز» و «فودور» (۱۹۶۳) و «كتز» و «پستال» (۱۹۶۴) وارد كار ترجمه ماشینی كردند. در مرحله بعد نیز كاربردشناسی وارد حوزه پردازش زبان شد.
انسان، دانشی از عالم خارج دارد كه آن را در تعبیر متن به كار میبندد: از این رو نظریههای گوناگونی درباره شكل تجربه انسان از عالم خارج، عرضه شد. یعنی متخصصان سعی كردند دانش عالم خارج را در حافظه رایانه بگنجانند و عاقبت به این نتیجه رسیدند كه بهتر است دانش گسترده عالم خارج را محدود كنند. به این سبب به جای ذخیره كل دانش در حافظه رایانه، موضوع عالم فرعی[۱۸] و نمایشنامه[۱۹] و فیلمنامه[۲۰] مطرح شد كه همگی، شكلهای مختلف ذخیره دانش عالم خارج در رایانه هستند.
سیدمهدی سمایی
استادیار پژوهشگاه اطلاعات و مدارك علمی ایران
منابع
باطنی، محمدرضا (۱۳۶۴). جمله، واحد ترجمه. در مجموعه مقالاتی پیرامون زبان و زبانشناسی (ص. ۷۲-۶۳). تهران: فرهنگ معاصر.
حسنیان، حسین (۱۳۶۸). گروه اسمی زبان فارسی برمبنای نظریه ایكس تیره. مجله زبانشناسی، ۶(۱)، ۴۰-۲۹.
سمائی، سیدمهدی (۱۳۸۱). پردازش گروه اسمی. فصلنامه اطلاعرسانی، ۱۸(۱ و ۲)، ۴۱-۳۴.
صادقی، علی اشرف و ارژنگ، غلامرضا (۱۳۵۶). دستور سال دوم فرهنگ و ادب. تهران: انتشارات آموزش و پرورش.
مشكوهٔالدینی، مهدی (۱۳۶۶). دستور زبان فارسی برپایه نظریه گشتاری. مشهد: انتشارات دانشگاه فردوسی.
میلانیان، هرمز (۱۳۵۱). دستگاه عدد در زبان فارسی. به كوشش محمد روشن، سومین كنگره تحقیقات ایرانی: ج ۱. (ص. ۶۴۵-۶۳۱). تهران: بنیاد فرهنگ ایران.
Booth, K. H. V. (۱۹۶۷). Machine aided translation with a post-editor. In A. D. Booth (Ed.), Machine Translation (pp. ۵۳-۷۶). Amsterdam: North-Holland Publishing Company.
Delavenay, Emile (۱۹۷۲). La machine a traduire.Paris: PUF.
Dreyfus, H. L. & Dreyfus, S. E. (۱۹۸۹). Mind over machin. Oxford, UK: B. Blackwell.
Katz, J., & Fodor, J. (۱۹۶۳). The structure of a semantic theory. Language, ۳۹, ۱۷۰-۲۱۰.
Katz, J. J., & Postal, P. M. (۱۹۶۴). An integrated theory of linguistic descriptions. Cambridge: MIT press.
Mahmoudi, S. M. (۱۹۹۴). Contribution au traitement automatique de la langue persane. These de doctorat, Universite de Lyon II
Trask, R. L. (۱۹۹۳). A dictionnary of grammatical terms in linguistics. London: Routledge.
پینوشتها
[۱]. Lexical ambiguity
[۲]. Structural ambiguity
[۳]. Boot
[۴]. Weaver
[۵]. Word Order
[۶]. Key words
[۷]. Richens
[۸]. Ending
[۹]. Reifler
[۱۰]. Pre-editing
[۱۱]. Post-editing
[۱۲]. Interactive
[۱۳]. Osvald
[۱۴]. Fletcher
[۱۵]. Dostert
[۱۶]. Garvin
[۱۷]. Polysemy
[۱۸]. Subworld
[۱۹]. Scripts
[۲۰]. Scenario
[۲۱]. Homonymy
[۲۲]. Context
[۲۳]. Noun Phrase
[۲۴]. Harris
[۲۵]. Paradigmatic axe
[۲۶]. Syntagmatic axe
[۲۷]. Recursive
ایران مسعود پزشکیان دولت چهاردهم پزشکیان مجلس شورای اسلامی محمدرضا عارف دولت مجلس کابینه دولت چهاردهم اسماعیل هنیه کابینه پزشکیان محمدجواد ظریف
پیاده روی اربعین تهران عراق پلیس تصادف هواشناسی شهرداری تهران سرقت بازنشستگان قتل آموزش و پرورش دستگیری
ایران خودرو خودرو وام قیمت طلا قیمت دلار قیمت خودرو بانک مرکزی برق بازار خودرو بورس بازار سرمایه قیمت سکه
میراث فرهنگی میدان آزادی سینما رهبر انقلاب بیتا فرهی وزارت فرهنگ و ارشاد اسلامی سینمای ایران تلویزیون کتاب تئاتر موسیقی
وزارت علوم تحقیقات و فناوری آزمون
رژیم صهیونیستی غزه روسیه حماس آمریکا فلسطین جنگ غزه اوکراین حزب الله لبنان دونالد ترامپ طوفان الاقصی ترکیه
پرسپولیس فوتبال ذوب آهن لیگ برتر استقلال لیگ برتر ایران المپیک المپیک 2024 پاریس رئال مادرید لیگ برتر فوتبال ایران مهدی تاج باشگاه پرسپولیس
هوش مصنوعی فناوری سامسونگ ایلان ماسک گوگل تلگرام گوشی ستار هاشمی مریخ روزنامه
فشار خون آلزایمر رژیم غذایی مغز دیابت چاقی افسردگی سلامت پوست