چهارشنبه, ۱۰ بهمن, ۱۴۰۳ / 29 January, 2025
سیستم مترجم صوتی
مردم دنیا با استفاده از وسائل ارتباطی جمعی روز به روز به یکدیگر نزدیکتر میشوند. وجود اینترنت و ماهواره مرز بین کشورها و بعد جغرافیایی بین آنها را از بین برده است. امروزه تفاوت بین مردم در زبان و فرهنگ آنهاست. درآیندهای نزدیک با بوجود آمدن پلهای ارتباطی برقراری ارتباط هر چه بیشتر بین اهالی دهکده جهانی آسانتر میشود. سیستم مترجم صوتی یکی از پلهای ارتباطی است که نقش مهمی در برقراری ارتباط بین افراد ایفا خواهد کرد. با استفاده ازمترجم صوتی افراد با زبانهای مختلف سخن یکدیگر را درک میکنند و و قادربه پاسخگویی خواهند بود. در واقع افراد با زبانهای متفاوت، توانایی برقراری ارتباطی صحیح را پیدا میکنند، چرا که ارتباط عبارت است از فراگرد انتقال پیام از سوی فرستنده به گیرنده با این شرط که درگیرنده پیام، مشابهت معنی با نظر فرستنده وجود داشته باشد.
MT (machine Translation) ترجمه اتوماتیکی متن از یک زبان به زبان دیگر است.
موسسه راکفلر در نیویورک اولین تحقیقات در رابطه با MT یا ماشین ترجمه را در سال ۱۹۴۶ آغاز کرد و تاکنون دستاوردهای مهمی داشته است. از سه سال پیش، در دانشگاهی در جنوب کالیفرنیا یک تیم از محققین روی سیستمی کار میکنند که میتواند با دریافت صدای افراد زبان گویشی آنها را به زبان شنیداری برای فرد دیگر ترجمه کند. این سیستم به گونهای تعبیه شده است که سخن افراد را دریافت میکند و سپس آن را به زبان دیگری ترجمه کرده و کلام ترجمه شده را پخش مینماید. در واقع این سیستم صدای افراد را به زبان خودشان دریافت میکند و سپس آن را ترجمه مینماید و در نهایت به فرد مقابل منتقل میکند. شبیهسازی اولیه این سیستم گفتوگویی است که بین پزشک و بیمار صورت میگیرد.
دو زبانی که در مرحله اولیه برای گفتوگوی بین پزشک و بیمار در نظر گرفته شده، زبان فارسی و زبان انگلیسی است. این سیستم روی laptap پرسرعت نصب میشود و سیستمعامل آن unix میباشد. پزشک و بیمار هر دو از هدفونی استفاده میکنند که میکروفونی به آن متصل است و نیز کلیدی در آن تعبیه شده است که بین بیمار و پزشک تغییر وضعیت میدهد. ویژگی مهم این سیستم بعنوان رابط بین پزشک و بیمار در database آن است که تاکنون ۳۰۰ مکالمه پزشک انگلیسی زبان با بیمار فارسی زبان درآن ایجاد کردهاند. به عبارتی پزشک به زبان انگلیسی از بیمار سئوالاتی میکند و بیمار با استفاده از این سیستم صحبتوهای پزشک را به زبان فارسی میشنود و در نهایت بیمار پاسخهایی را به زبان فارسی به پزشک میدهد و پزشک نیز به زبان انگلیسی آن را دریافت میکند.
در واقع این سیستم سئوالات انگلیسی پزشک را با نرمافزار تشخیص صدا ذخیره میکند و با database موجود مقایسه مینماید، سپس سئوال مربوطه را به فارسی ترجمه میکند و بیمار در گوشی خود سئوال پزشک را میشنود. در مرحله بعدی پاسخ به زبان فارسی بیمار ترجمه شده و به پزشک منتقل میشود. این سیستم مانند پلی بین پزشک و بیمار و در مراحل گستردهتر وسیله ارتباطی مناسبی بین دو فرد با دو زبان متفاوت میباشد. در طراحی و پیادهسازی این سیستم تیمی از محققین کار میکنند که در رشتههای متفاوتی صاحبنظر هستند. پروفسور Narayanan سرپرست تیم پروژه مترجم صوتی میباشد.
او مهندس الکترونیک و کامپیوتر است و نیز سمت استادی در زمینه زبانشناسی دارد. در بین اعضای این گروه چند تن از پزشکان ایرانی مقیم لسآنجلس فعالیت مستمر دارند و همچنین خانم دکتر شادی گنجوی که دارنده مدرک دکتری در رشته زبانشناسی است، یکی از اعضای مهم این تیم میباشند. به گفته سرپرست تیم؛ پروفسور Narayanan؛ خانم گنجوی بدلیل آشنایی با ساختار زبان فارسی و انگلیسی نقش مهمی در این پروژه ایفا میکنند. محققین موسسه viterbi - که یکی از مهمترین موسسههای تحقیقاتی در این زمینه است- امیدوارند که ظرف دو سال آینده یا حتی نزدیکتر این پروژه را به مرحله نهایی برسانند و نیز اعتقاد دارند که این سیستم نه تنها از کارایی بسیار بالایی برخوردار است بلکه در شرایط گوناگون بخصوص در مواقع اضطراری و اورژانسی بسیار کاربرد خواهد داشت.
مهندسین و اساتید در لابراتوارهای این موسسه به تجزیه و تحلیل جملات و تفسیر آنها میپردازند. آنها روی تبدیل ساختار زبانها و همچنین خطاهای موجود و ایراداتی که امکان وجود آنها زیاد است تحقیق میکنند، تا ترجمه جملات بطور صحیح و کامل انجام شود و منظور گوینده بطور دقیق به شنونده منتقل گردد. به همین منظور برای انجام این پروژه مبلغ ۸/۳ میلیون دلار سرمایهگذاری شده است تا تحقیقی کامل و جامع در زمینه مترجم صوتی انجام گیرد. از ویژگیهای بسیار مهم مترجم صوتی، سرعت بالا و نیز مبرا بودن از خطا میباشد.
این سیستم دارای بخشهایی اعم از سختافزار و نرمافزار است. سختافزار آن میکروفون، برای دریافت صدا و بلندگو، برای انتقال صدا میباشد. نرمافزار آن نیز از چندین قسمت تشکیل شده است، ابتدا کلام ورودی به متن تبدیل شده، سپس به زبانی دیگر برگردان میشود و در مرحله نهایی به صوت تبدیل میگردد. نرمافزارهایی در این زمینه وجود دارد که هر یک از این مراحل را به صورت تکی انجام میدهد و تاکنون سیستمی که بتواند در کثری از ثانیه و درسطحی وسیع این عملیات را انجام دهد، طراحی نشده بود.
به عنوان نمونه، نرمافزارهایی وجود دارد که صدای افراد را دریافت کرده و کلام آنها را تشخیص داده، سپس بصورت متن آن را نمایش میدهد که البته چنین نرمافزارهایی در زبان مختلف موجود است که از کارایی بالایی برخوردار میباشد. ساختار کلی این نرمافزارها به گونهای است که بعد از گرفتن مشخصات کلی از کاربر یک profile اختصاصی برای فرد ایجاد میکنند. زیرا این نرمافزار بایستی با نحوه بیان و سخن گفتن فرد آشنا شود. سخن گفتن شاخصهای است که از فرد تا فرد متفاوت میباشد، افرادی تند سخن میگویند، افرادی به آرامی و با طمانینه صحبت میکنند، صدای بعضی بلند است و برخی دیگر صدایشان ضعیف است و اقسام دیگر که میبایست این نرمافزار با آن آشنا شود.
بعد از ایجاد هر profile، چندین متن از پیش تعیین شده روی صفحه نمایش ظاهر میشود و این نرمافزار از کاربر درخواست میکند تا در مدت تعیین شده صفحات را شمرده و آرام با صدایی یکنواخت بخواند تا نحوه گویش کاربر را ذخیره نماید و با هر بار سخن گفتن فرد کلام او را تشخیص دهد و قادر باشد حروف آن را کنار هم بگذارد و در نهایت متن تایپ شده را نمایش دهد. نرمافزارهای نیز برای ترجمه زبانهای مختلف به یکدیگر وجود دارد. بیشتر زبانهای دنیا مانند انگلیسی، آلمانی، فرانسه، ژاپنی، چینی و ... دارای ساختار زبانی مشخصی هستند که توسط زبانشناسان به صورت مکتوب در آمده است.
پیادهسازی نرمافزارهای برگردان هر یک از این زبانها از زبان مبدا به زبان مقصد که ساختار زبانی آن نیز در دسترس است، توسط افراد متخصص صورت گرفته که طبق آمار بدست آمده از کارایی بسیار بالایی برخوردار بوده، بگونهای که درصد خطا در آنها بسیار پایین است. متاسفانه با وجود تلاشهای بسیار توسط اساتید ادبیات فارسی، هنوز ساختار زبان فارسی به درستی مشخص نشده است، در نتیجه نرمافزارهایی که به منظور برگردان زبان فارسی به زبانی دیگر و یا از زبانی دیگر به زبان فارسی موجود است از خطا مبرا نیستند.
یکی از مشکلاتی که درسیستم مترجم صوتی وجود دارد ذخیرهسازی ۹۰۰۰ لغت فارسی و۲۳۰۰۰ لغت انگلیسی است که این ارقام تناسبی با هم ندارد و دلیل آن را به ساختار زبان فارسی مربوط میکنند. نرمافزار تبدیل متن به صوت از سالها پیش در زبانهای مختلف وجود داشته است و از کارایی بسیار بالایی نیز برخوردار است، زیرا برای هر یک از حروف در هر زبان، صوتی وجود دارد و همانگونه که با کنار هم قرار دادن حروف، کلمات ساخته میشود، با قرار گرفتن صدای هر حرف کنار هم، آوای آن سخن ایجاد میگردد. پروفسور Narayanan معتقد است برای انجام چنین پروژهای می بایست سه اصل کلی را درنظر گرفت:
۱) ترجمه متن
ترجمه عبارت است از انتقال پیام از زبان مبدا به شکل زبان مقصد. ترجمه یعنی برگردان یک واژه، مطلب، متن، مفهوم و یا اندیشه از زبانی به شکل زبان دیگر، به نحوی که حداکثر اصالت محتوای آن موضوع رعایت شود و در عین حال برای خوانندهای که به زبان او برگردانده شده، به بهترین شکل ممکن قابل درک و بهرهبرداری باشد. نرمافزار مترجم صوتی در مراحل مختلفی این عملیات را انجام میدهد. ابتدا زبان مبدا را به زبان مقصد تبدیل میکند. دراولین قدم این سیستم متن را به لغات و سپس به جملات تقسیم میکند و نقش دستوری یا گرامری کلمات را در جمله بررسی مینماید. این سیستم بدلیل داشتن ساختار زبان مبدا و ساختار زبان مقصد به مقایسه و شناسایی شباهتها و تفاوتهای بین دو زبان و طبقهبندی لغاتی از قبیل ماهها ، مکانها، جهتها و... و نیز بررسی نقش معنایی آنها در جملات میپردازد.
شناخت این موارد موجب بوجود آمدن برگردانی صحیح از جملات میشود که در این سیستم به خوبی اجرا شده است. مترجم صوتی بجای ترجمه لغت به لغت از مفهوم جملات برای برگردان آن به زبانی دیگر استفاده میکند. زیرا با ترجمه کلمه به کلمه معنی درستی از گفتار شنیده شده حاصل نمیشود. واضح است که واژهها بیانگر معانی و مقاصد گوناگونی میباشند. هر واژه ممکن است یک یا چند معنی حقیقی یا مجازی داشته باشد و که در زبانهای مختلف از تنوع بسیاری برخوردار است. تشخیص معنی موردنظر گوینده و نیز برگردان صحیح آن از اهمیت بسزایی برخوردار است.
پروفسور Narayanan میگوید: در مکالمه نبایستی به ترجمه کلمه به کلمه و کدهای کامپیوتری متکی بود. هدف اصلی در این سیستم برداشت مفهومی از گفتوشنود است تا دو طرف مکالمه از نظرات هم بطور کامل آگاهی یابند، زیرا در هر زبان یک معنی، منظور، مقصود و یا مفهوم را میتوان به اشکال گوناگون بیان کرد. توانایی تمیز دادن واژههای هم لفظ، هم آوا، هم نویسه و چند معنایی در مترجم صوتی لحاظ شده است. نام دارو در این سیستم، ترجمه نمیشود زیرا نام تجاری داروها و حتی بعضی از اصطلاحات در پزشکی در تمامی زبانها در دو طرف مکالمه به یک صورت واحد بیان میشود.
۲) زبان گفتاری
زبان گفتاری با زبان نوشتاری متفاوت است. تنوع گوناگون گویشها و لهجهها یکی از مسائلی است که میبایست به آن توجه ویژه شود. نوع ادبیات در انواع مختلف مکالمهها، ملاقاتها، دادگاهها، گزارشها، گفتوگوهای پزشکی و از این قبیل موارد، هر یک سبک و سیاق خاص خود را دارد. شرایط خاصی که در مواقع اضطراری بوجود میآید سیستمی را میطلبد که با سرعت زیاد کلام را تشخیص دهد، ترجمه کند و منتقل نماید. تشخیص جملات و کلمات غیررسمی یا به عبارتی خودمانی در طراحی این سیستم لحاظ شده است. حتی در رابطه با مکالمههای تلفنی اورژانسی هم پیشبینیهایی صورت گرفته است. زیرا میبایست در چنین شرایطی پزشک و فرد سخن یکدیگر را بدرستی دریابند تا فرد شرایط بیمار را برای پزشک توصیف کند و پزشک با تشخصی صحیح فرد را به درستی راهنمایی نماید.
۳) ارتباط غیرکلامی
پیامهای غیرکلامی سهم خاصی در دامنه ارتباطات انسانی دارند. سخن گفتن آمیخته با عناصر غیرکلامی است، حرکات بدن یکی از وسیلههای اصلی برای انتقال پیام در ارتباطات میباشد زیرا انسانها فقط با سخن گفتن قادر به بیان حالات خود نیستند. ارتباط غیرکلامی هم شنیداری و هم دیداری و نیز شامل حرکات و اشارات ارادی و غیرارادی میباشد. حرکات چهره، تن صدا، سکوتهای بین جملات، سرعت بیان جملات و و بطور کلی حالت و آهنگ صدا از موارد ارتباطات غیرکلامی است که دامنه وسیعی در انتقال پیام از فرستنده به گیرنده دارد. این مسائل خود یکی از مشکلات ترجمه ماشینی است. در این مرکز پژوهشی، محققین تحقیقات وسیعی در رابطه با تجزیه و تحلیل و تفسیر جملات انجام میدهند و در صدد پیادهسازی سیستمی هستند که حالات مختلف انسانی در ارتباطات غیرکلامی را کشف کنند. پروفسور Narayanan معتقد است که سیستم ما میبایست سخن بیمار و پزشک را تحلیل و تفسیر نماید.
شناسایی سیلابهای مهمل مانند um ,uh, ah, er و یا جملات سادهای که قابل حذف می باشد مانند you know , like wow ! hey در پیاده سازی مترجم صوتی از اهمیت بسزای برخوردار است که خود از مشکلات این پروژه است. واضح است که سرعت تصمیمگیری ماشین در این موارد بسیار مهم میباشد. برای این سیستم دفترچه راهنمای فارسی و انگلیسی تعبیه شده است که خواندن آن را به کاربران توصیه میکنند.
با وجود پیشرفتهای صورت گرفته در زمینه پزشکی هنوز سئوالات بیپاسخ فراوانی در رابطه با چگونگی عملکرد مغز انسان وجود دارد. قدرت فکر و اندیشه در تشخیص جنبه معنایی کلمات و سرعت عمل مغز انسان در پاسخگویی به آن از موارد مهم پژوهشی است که در مراکز تحقیقاتی و دانشگاهی معتبر دنیا با جدیت کار میشود. در آینده شاهد خواهیم بود که فکر و اندیشه به کدهای کامپیوتری تبدیل میشود و تحولی عظیم در علوم مختلف ایجاد میکند. سیستم مترجم صوتی نیز با درک صحیح از اندیشه انسان، کلام را به درستی ترجمه خواهد نمود.
نوشین هژبرنژاد
ایران مسعود پزشکیان دولت چهاردهم پزشکیان مجلس شورای اسلامی محمدرضا عارف دولت مجلس کابینه دولت چهاردهم اسماعیل هنیه کابینه پزشکیان محمدجواد ظریف
پیاده روی اربعین تهران عراق پلیس تصادف هواشناسی شهرداری تهران سرقت بازنشستگان قتل آموزش و پرورش دستگیری
ایران خودرو خودرو وام قیمت طلا قیمت دلار قیمت خودرو بانک مرکزی برق بازار خودرو بورس بازار سرمایه قیمت سکه
میراث فرهنگی میدان آزادی سینما رهبر انقلاب بیتا فرهی وزارت فرهنگ و ارشاد اسلامی سینمای ایران تلویزیون کتاب تئاتر موسیقی
وزارت علوم تحقیقات و فناوری آزمون
رژیم صهیونیستی غزه روسیه حماس آمریکا فلسطین جنگ غزه اوکراین حزب الله لبنان دونالد ترامپ طوفان الاقصی ترکیه
پرسپولیس فوتبال ذوب آهن لیگ برتر استقلال لیگ برتر ایران المپیک المپیک 2024 پاریس رئال مادرید لیگ برتر فوتبال ایران مهدی تاج باشگاه پرسپولیس
هوش مصنوعی فناوری سامسونگ ایلان ماسک گوگل تلگرام گوشی ستار هاشمی مریخ روزنامه
فشار خون آلزایمر رژیم غذایی مغز دیابت چاقی افسردگی سلامت پوست