پنجشنبه, ۹ فروردین, ۱۴۰۳ / 28 March, 2024
مجله ویستا

مروری بر برنامه‌های تشخیص صوت


مروری بر برنامه‌های تشخیص صوت
در جامعه امروز، سرعت اهمیت بسیار بالایی دارد. از رستوران‌های Fast Food گرفته تا عكس‌های فوری یك‌ ساعته؛ افراد همیشه در پی آن هستند تا در زمان كمتر، كار بیشتری انجام دهند. سال‌هاست كه افراد در جست‌وجوی برنامه‌های تشخیص صوت بسیار خوب هستند تا به آنها كمك كند سرعت تایپ و به طور كلـی سرعت كـار خـود بـا كامپیوتر را افزایش دهند. اغلـب افراد می‌توانند در هـر دقیقه حدود ۲۰ تا ۳۰ كلمه بنـویسند.
سرعت متوسط افراد اندكی بالاتر بوده و حدود ۴۰ تا ۶۰ كلمه در هر دقیقه است. این سرعت‌هـا را با سرعت ۱۶۰ كلمه در دقیقه كه می‌توانید با استفاده از فناوری تشخیص صوت به دست آورید، مقایسه كنید. تعجبی ندارد كه افراد در انتظار روزی باشند كه بتوانند پشت كامپیوتر خود بنشینند و به جای تایپ كردن، صحبت كنند.
اگـر در گذشته از یك برنامه تشخیص صـوت بهره می‌گرفتید، باید زمان زیـادی را صرف آموزش به كامپیوتر می‌كردید، دقت آن بسیار پایین بود و به ملزومات سیستم بسیاری نیز نیاز داشتید و این امر شما را دلسرد می‌ساخت. برنامه‌های تشخیص صوت، بر عملكرد كامپیوتر تأثیری منفی داشتند و غـالباً به یك ماشین قدرتمند برای عملكرد مؤثر نیاز داشتند. نسخه‌های اولیه نرم‌افزار تشخیص صوت از فناوری مجزای تكلم بهره می‌گرفتند؛ بدین معنا كه مجبور بودید بعد از گفتن هر كلمه مكث كنید تا كامپیوتر آن را درك كند و سپس كلمات ادا شده را به متـن تبدیل كند. با استفاده از فناوری مجزای تكلـم،‌ مجبور بودید آهستـه صحبت كنید و هر كلمه را به صورت مجزا تلفظ كنید.
نرم‌افزارهای تشخیص صوت (VRS) امروزی از فناوری تكلم پیوسته بهره‌ می‌گیـرند كه به افراد امكـان می‌دهد تا بـا سـرعت طبیعی صحبت كنند؛ اگر چه مواردی نیـز وجود دارد كه نـرم‌افزار بـاید سعـی كند تـا به مـوارد گفته شده برسد و عقب نماند.
با پیشرفت‌هـای اخیـر در زمینـه سخـت‌افزار كامپیـوتـر و فنـاوری تشخیص صـوت، پیشرفت‌های بسیـاری را در كارآیی تشخیص صوت شاهد هستیم. برخی برنامه‌هـای تشخیص صوت اكنون ادعا دارند كه میزان دقت آنهـا ۹۹ درصد است.
تشخیص صوت به قـدر كافی پیشرفت كرده و به كرات از آن استفاده می‌شود و افـراد بسیاری به آن دستـرسـی دارند. به عنـوان مثـال، مایكـروسـافت فنـاوری تشخیص صـوت را با ویـندوز ویستـا تلفیق ساخته است.
تمامی انواع نوشته‌ها متناسب با فناوری تشخیص صوت نیستند، مانند كدهای برنامه‌نویسی كامپیوتر، نوشته‌هایی كه پر از اسامی خاص هستند و یا نوشته‌هایی كه به كلمات تخصصـی نیـاز دارند. به عنـوان مثـال، شـركت Nuance واقع در آدرس زیر:
▪ www.nuance.com
نسخه‌هایی از Dragon Naturally Speaking را به فروش می‌رساند كه بـرای حرفه پزشكـی و حقوق طراحـی شـده است و كمـك می‌كنـد تا دقت كاربـران VRS كه در ایـن زمینه‌هـا به فعـالیـت می‌پـردازند، افـزایش یـابد. همـ‌چنین محیط‌هـای شلـوغ، منـاسب استفاده از فنـاوری تشخیص صـوت نیستند؛ زیـرا سـر و صدای محیط می‌تواند میزان دقت را كاهش دهد.
برزگ‌تریـن سوال كاربـران امـروزی آن است كه آیـا نرم‌افزارهـای تشخیص صـوت كارآیـی بیشتری نسبت به تایپ دارند یا خیر.
اغلب برنامه‌های تشخیص صوت به گونه‌ای طراحی شده‌اند كه شیوه‌های ورودی بسیاری را در اختیار شما قـرار می‌دهند و جایگزین صفحه كلید و مـاوس شما نمی‌شوند. كریس استرامیلو (Chris Strammiello)، مدیـر ارشد بازاریابـی تـولیدات در شركت Nuance، می‌گوید: «افراد غالباً میان برخـی از كنترل‌هـا در صفحه كلیـد و برخـی كنترل‌ها از طریق صدا، توازن برقرار می‌‌سازند. اما تركیب این دو، بسیار آسان‌تر و سریع‌تـر از استفـاده از صفحـه كلیـد به تنهایی است.»
تشخیص صوت دو عملكـرد اصلی دارد. اولین عملكرد، فرمان‌هـا را شناسایـی كـرده و به شمـا امكان می‌دهد تا با استفـاده از آن فرمان‌هـا، كامپیوتر خود را كنترل كنید. عملكرد دوم، به شما امكان می‌دهد تا با استفاده از كلام، متن را در سند یا برنامه‌ای وارد كنید. بسیاری از برنامه‌ها، هر دو عملكرد را با هم تلفیق می‌كنند.
▪ Dragon NaturallySpeaking Professional ۹
۹ Dragon NaturallySpeaking تنهـا بـرنـامه‌ای است كه پیش از استفاده از آن به آموزش نیاز ندارید. شركت Nuance اطمینان داده است كه میزان دقت این نرم‌افزار در تمام نسخه‌های آن یكسان است و فقط ویژگی‌های هر نسخه با نسخه دیگر تفاوت دارد.
در طول فرآیند نصب، این برنامه آموزش‌های بسیاری را به كاربر می‌دهد. شركت Nuance آموزش‌های مختصری را در خصوص تنظیمات میكروفن، تنظیمات صدا و ایجاد پروفایل كاربری در اختیار می‌گذارد. این آموزش‌ها نسبت به آموزش‌های سایر برنامه‌ها به زمان كمی نیاز دارند. پس از ایجاد پروفایل كاربری، Dragon NaturallySpeaking آماده استفاده است. این برنامه به شما امكان می‌دهد تا مستقیماً صحبت‌های خود را به اغلب برنامه‌های ویندوز دیكته كنیـد. بـرای راه‌انـدازی Dragon NaturallySpeaking به یك كامپیوتـر با پـردازنده پنتیـوم ۱ گیگاهرتـز، ۵۱۲ مگابایت RAM، گیگابـایت فضای خالی در هارددیسك، سیستم‌عامل ویندوز XP به همـراه Service Pack۱ (نسخه خانگی یا حرفه‌ای)، ویندوز ۲۰۰۰ دارای Service Pack۴ یا بالاتر و یك كـارت صـدا كه از ضبط ۱۶بیتی پشتیبانـی می‌كند، نیاز دارید.
۹ Dragon NaturallySpeaking از دیكتـه كـردن و فـرمـان دادن همزمـان پشتیبانـی می‌كند. این امر مـوجب می‌شود كـه سوئیچ میان منوهای برنامه‌ها و دیكته كردن متن بدون نیاز به ماوس یا صفحه كلید آسان باشد. به عنوان مثال، برای دستیابی به منوی File در برنامه Word، كافی است اندكی مكث كرده و سپس بگویید: File. به همین ترتیب،‌ اگر بگویید: «We will need this file for the meeting» این برنامه، متن گفته شده را وارد سند خواهد كرد. بسته به الگوهـای گفتـاری شما، برنامه تصمیـم می‌گیرد كه آیا تایپ كند و یا از حـالت فرمـان استفـاده كند.
با بهره‌گیری از برنامه AutoTranscribe Folder Agent می‌‌توانید به صورت خودكار، با استفـاده از یك پروفایل صوتی از پیش تعیین شده فایل‌های صوتی را از یك PDA‌ یا دستگاه ضبط كننده صدا به صورت متن در‌ آورید.
نسخه حرفه‌ای این برنامه همچنین به همراه یك ضبط كننده ماكرو عرضه شده است و از ماكروهای پیچیده پشتیبانی می‌كنـد. این ضبـط كننده ماكرو به شمـا امكـان می‌دهـد تا مجموعـه‌ای از حركات ماوس و عملیات‌های صفحه كلید را ضبط كنید تا بتوانید از طریق فرمان صوتـی آنها را تكرار كنید. همچنیـن نسخه حرفـه‌ای این بـرنـامه، به شما امكان می‌دهد تا لغات و ماكروها را برای استفاده توسط كامپیوتر به سیستم خود وارد كنید.
▪ Realize Voice ۴.۱
Realize Voice ۴.۱ واقع در آدرس زیر:
www.realizesoftware.com
از مـوتـور Microsoft Speech Recognition بـهــره می‌گـیرد. این موتور‌ به همراه ویندوز XP یا Office XP عرضه می‌شود.
برای بهره‌گیری از Realize Voice ۴.۱، به پردازنده پنتیوم ۲۶۶ (یا معـادل آن)، ۶۴ مگـابـایت RAM مگابـایـت توصیه می‌شود)، ویندوز ۹۸SE ،Me ،NT ،۲۰۰۰ و XP، یك كارت صدای سازگار و یك میكروفن با كیفیت بالا و دارای قابلیت از بین بردن نویزها نیاز است. پیش از استفاده از این برنامه، باید اندكی آموزش ببینید. بدین منظور باید متن را با صدای بلند بخوانید. همان‌طور كه بیشتـر آموزش می‌بینیـد، میـزان دقت Realize Voice افـزایش می‌یـابد. می‌توانید در این برنامه، ماكروهای صوتی ایجاد كنید كه به شما امكان می‌دهند تا ورودی صفحه كلید و ماوس را دریـافت كرده و با استفـاده از فرمـان صوتـی آن را انجام دهید. علاوه بر آن Realize Voice به شما امكان می‌دهد تا در اینترنت مرور كرده و بسیاری از برنامه‌های كامپیوتر خود را با استفاده از فرمان‌های صوتـی كنترل كنید.
هنگامـی كه از حـالت دیكته استفـاده می‌كنید، هـر آنچـه را كـه می‌گـویید به متن تبدیل می‌شود. سپس می‌تـوانید آن متن را در برنامه موردنظر خود قـرار دهیـد. اگـر چـه Realize Voice این متن را مستقیماً در برنامه مورد استفـاده قـرار نمی‌دهد. هنگامـی كه از حـالت فرمان بهره می‌گیرید، صفحه اصلی برنامه، فهرستی از تمام برنامه‌های موجود را نمایش می‌دهد.
▪ TalkItTypeIt ۲ Ultra
بـرنامه TalkItTypeIt۲ Ultra، واقع در آدرس زیـر:
www.xpressionsmedia.com
به یك پردازنده پنتیوم ۳ شركت Intel‌ با سرعت ۵۰۰مگاهرتز (یا معادل آن)، ۱۲۸ مگابایتRAM، مگابـایت فضـا خالی در هارددیسك، ویندوز NT۴.۰/Me/۹۸ دارای SP۶ وXP و یــك كــارت صـدای Sound Blaster ۱۶ شركت Creative‌ یا معادل آن نیاز دارد.
این برنامه از موتور Microsoft ۶.۱ Speech Recognition بـرای ترجـمه كلمات گفـتاری به نوشـتاری بـهـره می‌گیرد. TalkItTypeIt۲Ultra با امكـان دیكته كردن مستقیم به تمامـی برنامه‌های وینـدوز از جمله برنامه واژه‌پـرداز، صفحات گسترده برنامه‌های چیدمان صفحات و سایر برنامه‌ها، بر كارآیـی ایـن موتـور افزوده است. این برنامه بـا برنـامه‌هـای Word ،Excel ،outlook، Aol Instant Messenger ،Oppen office و بسیاری برنامه‌های دیگر سازگار است و هم‌چنین دارای حالت فرمانی است كه امكان دسترسی صوتی مستقیم به تمامی موارد قابل كلیك در روی صفحه را فراهم می‌كند.
TalkItTypeIt۲ دارای فرهنگ لغاتی مشتمل بر ۶۰هزار لغت است و می‌‌توانید لغات جدیدی از قبیل اسامی و عبارات تخصصی را بر حسب نیازهای خود به آن اضافه كنید.
نسخه Ultra این برنامه، به شما امكان می‌دهد تا به منظور خودكارسازی فرآیند زدن كلیدهایی كه مرتباً مورد استفاده قــرار می‌دهیـد، كلیك‌ هـای مـاوس و تـركیب ایـن دو مـورد، فرمان های ماكرو را ایجاد كنید. همچنین می‌توانید ماكروهای كلی و یا تخصصی ایجاد كنید.
TalkIt TypeIt ۲ همچنیـن دارای ویـژگـی Transcriber است كه بـه شما امكـان می‌دهـد تا صدای ضبط شده خود را به متـن تبدیـل كنیـد. همچنیـن می‌تـوانـید آن را بـا هـر ضبط كننده صدای دیجیتالی مورد استفاده قرار دهید و صدا را به شكل یك فایل WAV ذخیره كنید.
به خاطـر داشته باشید كه كیفیـت صدای میكـروفن و یا هدستـی كه مورد استفاده قرار می‌دهید، می‌تواند به میزان بسیار زیادی بر دقت تشخیص صوت تاثیر بگذارد. همچنین صدای پس‌زمینه و سایـر عوامل می‌توانند میزان دقت این فرآیند را كاهش دهند.
به منظور مقایسه سرعت تایپ با سرعت برنامه تشخیص صوت، به بخش مسابقه تایپ برنامه:
Dragon Naturally Speaking ۹
واقع در آدرس زیر:
http://nuance.com/talk
مراجعه كنید. در آنجا مشاهده خـواهید كرد كه تا چه میزان می‌تـوانید با استفاده از فناوری تشخیص صوت بر سرعت تایپ خود بیفزایید.
به هنگـام انتخاب یك برنامه تشخیص صوت به ملزومات سیستم آن بـرنامه و سازگـاری آن با برنـامه‌هایی از قبیل Word و Excel توجه داشته باشید.
همچنیـن به خاطر داشته باشید كه یك هدست و میكروفن با كیفیت، نتیجه بهتری را فراهم می‌كند.
مترجم: فرناز رجبی‌مهر
منبع : وب ایران


همچنین مشاهده کنید