دوشنبه, ۲۲ بهمن, ۱۴۰۳ / 10 February, 2025
مروری بر برنامه های تشخیص صوت
![مروری بر برنامه های تشخیص صوت](/web/imgs/16/162/o6csk1.jpeg)
در جامعه امروز، سرعت اهمیت بسیار بالایی دارد. از رستورانهای Fast Food گرفته تا عكسهای فوری یك ساعته؛ افراد همیشه در پی آن هستند تا در زمان كمتر، كار بیشتری انجام دهند. سالهاست كه افراد در جستوجوی برنامههای تشخیص صوت بسیار خوب هستند تا به آنها كمك كند سرعت تایپ و به طور كلـی سرعت كـار خـود بـا كامپیوتر را افزایش دهند. اغلـب افراد میتوانند در هـر دقیقه حدود ۲۰ تا ۳۰ كلمه بنـویسند.
سرعت متوسط افراد اندكی بالاتر بوده و حدود ۴۰ تا ۶۰ كلمه در هر دقیقه است. این سرعتهـا را با سرعت ۱۶۰ كلمه در دقیقه كه میتوانید با استفاده از فناوری تشخیص صوت به دست آورید، مقایسه كنید. تعجبی ندارد كه افراد در انتظار روزی باشند كه بتوانند پشت كامپیوتر خود بنشینند و به جای تایپ كردن، صحبت كنند.
اگـر در گذشته از یك برنامه تشخیص صـوت بهره میگرفتید، باید زمان زیـادی را صرف آموزش به كامپیوتر میكردید، دقت آن بسیار پایین بود و به ملزومات سیستم بسیاری نیز نیاز داشتید و این امر شما را دلسرد میساخت. برنامههای تشخیص صوت، بر عملكرد كامپیوتر تأثیری منفی داشتند و غـالباً به یك ماشین قدرتمند برای عملكرد مؤثر نیاز داشتند. نسخههای اولیه نرمافزار تشخیص صوت از فناوری مجزای تكلم بهره میگرفتند؛ بدین معنا كه مجبور بودید بعد از گفتن هر كلمه مكث كنید تا كامپیوتر آن را درك كند و سپس كلمات ادا شده را به متـن تبدیل كند. با استفاده از فناوری مجزای تكلـم، مجبور بودید آهستـه صحبت كنید و هر كلمه را به صورت مجزا تلفظ كنید.
نرمافزارهای تشخیص صوت (VRS) امروزی از فناوری تكلم پیوسته بهره میگیـرند كه به افراد امكـان میدهد تا بـا سـرعت طبیعی صحبت كنند؛ اگر چه مواردی نیـز وجود دارد كه نـرمافزار بـاید سعـی كند تـا به مـوارد گفته شده برسد و عقب نماند.
با پیشرفتهـای اخیـر در زمینـه سخـتافزار كامپیـوتـر و فنـاوری تشخیص صـوت، پیشرفتهای بسیـاری را در كارآیی تشخیص صوت شاهد هستیم. برخی برنامههـای تشخیص صوت اكنون ادعا دارند كه میزان دقت آنهـا ۹۹ درصد است.
تشخیص صوت به قـدر كافی پیشرفت كرده و به كرات از آن استفاده میشود و افـراد بسیاری به آن دستـرسـی دارند. به عنـوان مثـال، مایكـروسـافت فنـاوری تشخیص صـوت را با ویـندوز ویستـا تلفیق ساخته است.
تمامی انواع نوشتهها متناسب با فناوری تشخیص صوت نیستند، مانند كدهای برنامهنویسی كامپیوتر، نوشتههایی كه پر از اسامی خاص هستند و یا نوشتههایی كه به كلمات تخصصـی نیـاز دارند. به عنـوان مثـال، شـركت Nuance واقع در آدرس زیر:
▪ www.nuance.com
نسخههایی از Dragon Naturally Speaking را به فروش میرساند كه بـرای حرفه پزشكـی و حقوق طراحـی شـده است و كمـك میكنـد تا دقت كاربـران VRS كه در ایـن زمینههـا به فعـالیـت میپـردازند، افـزایش یـابد. همـچنین محیطهـای شلـوغ، منـاسب استفاده از فنـاوری تشخیص صـوت نیستند؛ زیـرا سـر و صدای محیط میتواند میزان دقت را كاهش دهد.
برزگتریـن سوال كاربـران امـروزی آن است كه آیـا نرمافزارهـای تشخیص صـوت كارآیـی بیشتری نسبت به تایپ دارند یا خیر.
اغلب برنامههای تشخیص صوت به گونهای طراحی شدهاند كه شیوههای ورودی بسیاری را در اختیار شما قـرار میدهند و جایگزین صفحه كلید و مـاوس شما نمیشوند. كریس استرامیلو (Chris Strammiello)، مدیـر ارشد بازاریابـی تـولیدات در شركت Nuance، میگوید: «افراد غالباً میان برخـی از كنترلهـا در صفحه كلیـد و برخـی كنترلها از طریق صدا، توازن برقرار میسازند. اما تركیب این دو، بسیار آسانتر و سریعتـر از استفـاده از صفحـه كلیـد به تنهایی است.»
تشخیص صوت دو عملكـرد اصلی دارد. اولین عملكرد، فرمانهـا را شناسایـی كـرده و به شمـا امكان میدهد تا با استفـاده از آن فرمانهـا، كامپیوتر خود را كنترل كنید. عملكرد دوم، به شما امكان میدهد تا با استفاده از كلام، متن را در سند یا برنامهای وارد كنید. بسیاری از برنامهها، هر دو عملكرد را با هم تلفیق میكنند.
▪ Dragon NaturallySpeaking Professional ۹
۹ Dragon NaturallySpeaking تنهـا بـرنـامهای است كه پیش از استفاده از آن به آموزش نیاز ندارید. شركت Nuance اطمینان داده است كه میزان دقت این نرمافزار در تمام نسخههای آن یكسان است و فقط ویژگیهای هر نسخه با نسخه دیگر تفاوت دارد.
در طول فرآیند نصب، این برنامه آموزشهای بسیاری را به كاربر میدهد. شركت Nuance آموزشهای مختصری را در خصوص تنظیمات میكروفن، تنظیمات صدا و ایجاد پروفایل كاربری در اختیار میگذارد. این آموزشها نسبت به آموزشهای سایر برنامهها به زمان كمی نیاز دارند. پس از ایجاد پروفایل كاربری، Dragon NaturallySpeaking آماده استفاده است. این برنامه به شما امكان میدهد تا مستقیماً صحبتهای خود را به اغلب برنامههای ویندوز دیكته كنیـد. بـرای راهانـدازی Dragon NaturallySpeaking به یك كامپیوتـر با پـردازنده پنتیـوم ۱ گیگاهرتـز، ۵۱۲ مگابایت RAM، گیگابـایت فضای خالی در هارددیسك، سیستمعامل ویندوز XP به همـراه Service Pack۱ (نسخه خانگی یا حرفهای)، ویندوز ۲۰۰۰ دارای Service Pack۴ یا بالاتر و یك كـارت صـدا كه از ضبط ۱۶بیتی پشتیبانـی میكند، نیاز دارید.
۹ Dragon NaturallySpeaking از دیكتـه كـردن و فـرمـان دادن همزمـان پشتیبانـی میكند. این امر مـوجب میشود كـه سوئیچ میان منوهای برنامهها و دیكته كردن متن بدون نیاز به ماوس یا صفحه كلید آسان باشد. به عنوان مثال، برای دستیابی به منوی File در برنامه Word، كافی است اندكی مكث كرده و سپس بگویید: File. به همین ترتیب، اگر بگویید: «We will need this file for the meeting» این برنامه، متن گفته شده را وارد سند خواهد كرد. بسته به الگوهـای گفتـاری شما، برنامه تصمیـم میگیرد كه آیا تایپ كند و یا از حـالت فرمـان استفـاده كند.
با بهرهگیری از برنامه AutoTranscribe Folder Agent میتوانید به صورت خودكار، با استفـاده از یك پروفایل صوتی از پیش تعیین شده فایلهای صوتی را از یك PDA یا دستگاه ضبط كننده صدا به صورت متن در آورید.
نسخه حرفهای این برنامه همچنین به همراه یك ضبط كننده ماكرو عرضه شده است و از ماكروهای پیچیده پشتیبانی میكنـد. این ضبـط كننده ماكرو به شمـا امكـان میدهـد تا مجموعـهای از حركات ماوس و عملیاتهای صفحه كلید را ضبط كنید تا بتوانید از طریق فرمان صوتـی آنها را تكرار كنید. همچنیـن نسخه حرفـهای این بـرنـامه، به شما امكان میدهد تا لغات و ماكروها را برای استفاده توسط كامپیوتر به سیستم خود وارد كنید.
▪ Realize Voice ۴.۱
Realize Voice ۴.۱ واقع در آدرس زیر:
www.realizesoftware.com
از مـوتـور Microsoft Speech Recognition بـهــره میگـیرد. این موتور به همراه ویندوز XP یا Office XP عرضه میشود.
برای بهرهگیری از Realize Voice ۴.۱، به پردازنده پنتیوم ۲۶۶ (یا معـادل آن)، ۶۴ مگـابـایت RAM مگابـایـت توصیه میشود)، ویندوز ۹۸SE ،Me ،NT ،۲۰۰۰ و XP، یك كارت صدای سازگار و یك میكروفن با كیفیت بالا و دارای قابلیت از بین بردن نویزها نیاز است. پیش از استفاده از این برنامه، باید اندكی آموزش ببینید. بدین منظور باید متن را با صدای بلند بخوانید. همانطور كه بیشتـر آموزش میبینیـد، میـزان دقت Realize Voice افـزایش مییـابد. میتوانید در این برنامه، ماكروهای صوتی ایجاد كنید كه به شما امكان میدهند تا ورودی صفحه كلید و ماوس را دریـافت كرده و با استفـاده از فرمـان صوتـی آن را انجام دهید. علاوه بر آن Realize Voice به شما امكان میدهد تا در اینترنت مرور كرده و بسیاری از برنامههای كامپیوتر خود را با استفاده از فرمانهای صوتـی كنترل كنید.
هنگامـی كه از حـالت دیكته استفـاده میكنید، هـر آنچـه را كـه میگـویید به متن تبدیل میشود. سپس میتـوانید آن متن را در برنامه موردنظر خود قـرار دهیـد. اگـر چـه Realize Voice این متن را مستقیماً در برنامه مورد استفـاده قـرار نمیدهد. هنگامـی كه از حـالت فرمان بهره میگیرید، صفحه اصلی برنامه، فهرستی از تمام برنامههای موجود را نمایش میدهد.
▪ TalkItTypeIt ۲ Ultra
بـرنامه TalkItTypeIt۲ Ultra، واقع در آدرس زیـر:
www.xpressionsmedia.com
به یك پردازنده پنتیوم ۳ شركت Intel با سرعت ۵۰۰مگاهرتز (یا معادل آن)، ۱۲۸ مگابایتRAM، مگابـایت فضـا خالی در هارددیسك، ویندوز NT۴.۰/Me/۹۸ دارای SP۶ وXP و یــك كــارت صـدای Sound Blaster ۱۶ شركت Creative یا معادل آن نیاز دارد.
این برنامه از موتور Microsoft ۶.۱ Speech Recognition بـرای ترجـمه كلمات گفـتاری به نوشـتاری بـهـره میگیرد. TalkItTypeIt۲Ultra با امكـان دیكته كردن مستقیم به تمامـی برنامههای وینـدوز از جمله برنامه واژهپـرداز، صفحات گسترده برنامههای چیدمان صفحات و سایر برنامهها، بر كارآیـی ایـن موتـور افزوده است. این برنامه بـا برنـامههـای Word ،Excel ،outlook، Aol Instant Messenger ،Oppen office و بسیاری برنامههای دیگر سازگار است و همچنین دارای حالت فرمانی است كه امكان دسترسی صوتی مستقیم به تمامی موارد قابل كلیك در روی صفحه را فراهم میكند.
TalkItTypeIt۲ دارای فرهنگ لغاتی مشتمل بر ۶۰هزار لغت است و میتوانید لغات جدیدی از قبیل اسامی و عبارات تخصصی را بر حسب نیازهای خود به آن اضافه كنید.
نسخه Ultra این برنامه، به شما امكان میدهد تا به منظور خودكارسازی فرآیند زدن كلیدهایی كه مرتباً مورد استفاده قــرار میدهیـد، كلیك هـای مـاوس و تـركیب ایـن دو مـورد، فرمان های ماكرو را ایجاد كنید. همچنین میتوانید ماكروهای كلی و یا تخصصی ایجاد كنید.
TalkIt TypeIt ۲ همچنیـن دارای ویـژگـی Transcriber است كه بـه شما امكـان میدهـد تا صدای ضبط شده خود را به متـن تبدیـل كنیـد. همچنیـن میتـوانـید آن را بـا هـر ضبط كننده صدای دیجیتالی مورد استفاده قرار دهید و صدا را به شكل یك فایل WAV ذخیره كنید.
به خاطـر داشته باشید كه كیفیـت صدای میكـروفن و یا هدستـی كه مورد استفاده قرار میدهید، میتواند به میزان بسیار زیادی بر دقت تشخیص صوت تاثیر بگذارد. همچنین صدای پسزمینه و سایـر عوامل میتوانند میزان دقت این فرآیند را كاهش دهند.
به منظور مقایسه سرعت تایپ با سرعت برنامه تشخیص صوت، به بخش مسابقه تایپ برنامه:
Dragon Naturally Speaking ۹
واقع در آدرس زیر:
http://nuance.com/talk
مراجعه كنید. در آنجا مشاهده خـواهید كرد كه تا چه میزان میتـوانید با استفاده از فناوری تشخیص صوت بر سرعت تایپ خود بیفزایید.
به هنگـام انتخاب یك برنامه تشخیص صوت به ملزومات سیستم آن بـرنامه و سازگـاری آن با برنـامههایی از قبیل Word و Excel توجه داشته باشید.
همچنیـن به خاطر داشته باشید كه یك هدست و میكروفن با كیفیت، نتیجه بهتری را فراهم میكند.
مترجم: فرناز رجبیمهر
ایران مسعود پزشکیان دولت چهاردهم پزشکیان مجلس شورای اسلامی محمدرضا عارف دولت مجلس کابینه دولت چهاردهم اسماعیل هنیه کابینه پزشکیان محمدجواد ظریف
پیاده روی اربعین تهران عراق پلیس تصادف هواشناسی شهرداری تهران سرقت بازنشستگان قتل آموزش و پرورش دستگیری
ایران خودرو خودرو وام قیمت طلا قیمت دلار قیمت خودرو بانک مرکزی برق بازار خودرو بورس بازار سرمایه قیمت سکه
میراث فرهنگی میدان آزادی سینما رهبر انقلاب بیتا فرهی وزارت فرهنگ و ارشاد اسلامی سینمای ایران تلویزیون کتاب تئاتر موسیقی
وزارت علوم تحقیقات و فناوری آزمون
رژیم صهیونیستی غزه روسیه حماس آمریکا فلسطین جنگ غزه اوکراین حزب الله لبنان دونالد ترامپ طوفان الاقصی ترکیه
پرسپولیس فوتبال ذوب آهن لیگ برتر استقلال لیگ برتر ایران المپیک المپیک 2024 پاریس رئال مادرید لیگ برتر فوتبال ایران مهدی تاج باشگاه پرسپولیس
هوش مصنوعی فناوری سامسونگ ایلان ماسک گوگل تلگرام گوشی ستار هاشمی مریخ روزنامه
فشار خون آلزایمر رژیم غذایی مغز دیابت چاقی افسردگی سلامت پوست