چهارشنبه, ۱۷ بهمن, ۱۴۰۳ / 5 February, 2025
مجله ویستا
هرچه را که بنویسی میفهمم
از تایپ کردن خسته شدهاید؟ نمیتوانید مدت زمان زیادی را به نوشتن و دوباره تایپ کردن یک متن طولانی دانشگاهی یا گزارش خبریتان اختصاص دهید؟ آیا میخواهید صفحات یک کتاب را اسکن کنید تا بتوانید قسمتهای مورد نیازش را حذف و برخی قسمتهای دیگر را برای ویرایش و تغییر انتخاب کنید اما وقت ندارید؟ نامهای طولانی نوشتهاید اما آنقدر بدخط است که فقط خودتان میتوانید بخوانیدش و مجبورید دوباره تایپ کنید؟ پیشنهاد ما این است که از فناوری نوین و جالب OCR استفاده کنید.
فناوری تشخیص یا ادراک نوری حروف که از آن به عنوان Optical Character Recognition یا اختصاراً OCR نام میبرند، یکی از انواع نرمافزارهای کامپیوتری است که برای ترجمه تصاویر حاوی دستنوشتهها و یا تایپنوشتههای غالباً ثبتشده توسط اسکنر، به متن و حروف قابل درک و فهم برای کامپیوتر استفاده میشود.
این فناوری از تشخیص قالب و الگو، هوش مصنوعی و چشم ماشینی استفاده میکند تا متنهایی را که بهصورت پرینتشده یا دستنوشته بر روی کاغذهای معمولی در اختیار داریم به متنهای قابل ویرایش توسط نرمافزارهای ادیتور متن با کامپیوتر بدل کند.
معمولاً از OCR در مواقعی استفاده میشود که فرصت زیادی برای تایپ کردن متون وجود ندارد و شما میخواهید به سرعت متنی را که به شکل دستنوشته با قلم یا خودکارهای معمولی روی کاغذ نوشتهاید، اسکن کنید تا بتوانید آن را به شکلهای مختلف، ویرایش متنی کنید.
یکی دیگر از کاربردهای فناوری تشخیص بصری حروف در زمانی است که شما میخواهید متن مقالات، کتابها یا نوشتههای از قبل پرینتشدهای را اسکن و مجدداً ویرایش و ارسال کنید که حجم زیادی دارند و ذخیرهسازی آنها در قالب فایلهای تصویری مثل JPEG یا GIF امکانپذیر نیست.
نرمافزارهای جدید OCR که غالباً از آنها در گوشیهای تلفنهمراه یا کامپیوترهای قابل حمل مجهز به صفحههای لمسی و Padهای نوشتار با قلم نوری استفاده میشود، امکانی برای تمرین کردن دارند، به این معنی که هر کاربر جدید، در مدت زمانی خاص متونی مشخصشده را با دستخط خود مینویسد و از طریق اسکنر یا Touch Pad به نرمافزار ارسال میکند تا سنسورهای مصنوعی و نرمافزاری بصری، با این دستخط آشنا شوند و بتوانند همواره آن را درک کنند.
مطمئنا ماشین یا کامپیوتر به عنوان یک دستگاه صرف، دارای هوش و ادراک انسانی نیست و نمیتواند متنهایی را که بهصورت دستخط به او داده میشود درک کند؛ ضمن اینکه کامپیوتر، تمامی تصاویر ذخیرهشده با فرمتهای تصویری مثل Gif را تنها به عنوان یک تصویر میشناسد و هیچ گاه محتویات آن را برای ویرایش درک نمیکند. به همین رو نیاز است تا در صورتی که از آن برای تشخیص دستخط انسانی استفاده میشود، به مدتی خاص تحت تمرین قرار بگیرد.
نمونه این تمرین برای افزایش هوش مصنوعی کامپیوتر را در مجموعه تازه ارایهشده Office ۲۰۰۳ میتوانیم بیابیم، جایی که در نرمافزارهایی مثل Word شما میتوانید فرمانهای صوتی را برای اجرای دستورها و توابع مختلف به نرمافزار بدهید. برای این کار و افزایش بازدهی عملگر فرمان صوتی که بتواند دقیقتر و با درصد خطای کمتری کلام شما را متوجه شود، بخشی با عنوان Speech Training وجود دارد که در آن شما متنهای مشخصی را با صدای خودتان برای نرمافزار میخوانید و حافظه مجازی نرمافزار نیز فرکانسها و بسامدهای صدای شما را ذخیره میکند و هر لغت جدیدی را که شما ادا کنید، بدون مشکل تشخیص میدهد.
با این تفاسیر میتوانیم به طور خلاصه این گونه جمعبندی کنیم که OCR برای تبدیل تصاویر محو و مبهم به متنهای قابل درک و ویرایش مورد استفاده قرار میگیرد و اشکال گرافیکی را به کدهای ASCII و Unicode تبدیل میکند، به شکلی که فونت، اندازه، استیل، صفحهآرایی و تمام مختصات پاراگرافی آنها قابل ویرایش باشد.
● تاریخچه
در سال ۱۹۲۹ برای نخستین بار، گوستاو توشچک از آلمان، امتیازی برای اختراع خود با نام OCR دریافت کرد و از همان زمان، کار طراحی نرمافزارهای هوشمند درک متن را آغاز کرد.
اختراع او، یک دستگاه اسکنر نوری بود که یک سری الگوهای متنی آماده را در خود ذخیره میکرد و متنهایی که دریافت میکرد در صورت تطابق کامل و تشابه، بدون کم و کاست با الگوی ابتدایی ذخیرهشده، درک میکرد و به کامپیوتر میداد.
ایراد اختراع او این بود که یک نمونه از پیش تهیهشده شامل شکل کوچک و بزرگ حروف الفبا در اختیار داشت و در صورتی که متن ارایهشده به دستگاه، کوچکترین تفاوتی با الگو و نمونه آماده داشت، قادر به تشخیص نبود. با این حال، این کار سرآغاز ارایه اختراعاتی شد که بعدها به تولید نرمافزارهای هوشمند تشخیص متن انجامید. در حال حاضر، این نرمافزارها برای درک متون تصویری به زبانهای مختلف طراحی شدهاند و نمونههای جدید آنها بر روی بسیاری از گوشیهای تلفنهمراه نصب شده است.
اساس و پایه کار قلمهای نوری یا Light penهایی که همراه با برخی گوشیهای تلفنهمراه ارایه میشوند نیز همین فناوری است. زمانی که شما برای تایپ کردن متن یک پیام کوتاه یا شمارهگیری کردن، بدون در اختیار داشتن هیچ کیبوردی، تنها به نوشتن معمولی اعداد و حروف با دستخط خاص خودتان مبادرت میکنید، یعنی در حال استفاده از ثمرات OCR هستید، آن هم به شکلی که یک صفحه کریستال مایع هوشمند به کمک قلم نوری، امکان درک و ردیابی خطوط به ظاهر بیمعنی و ترسیمشده توسط شما را فراهم میکند.
در سال ۱۹۵۰ دومین نمونه نرمافزار تشخیص خط بصری کاراکترها توسط دیوید شپارد از سرویس جاسوسی سازمان نیروهای مسلح ایالات متحده طراحی شد. شپارد که متخصص رمزشکنی و باز کردن قفلهای مخفی اطلاعاتی و متنی بود، با همکاری یک پروفسور ژاپنی، نمونهای از نرمافزار نوین OCR را طر احی کرد که نیازی به الگوی ثابت از پیشتعیینشده نداشت و به راحتی میتوانست دستخطهای افراد مختلف را درک کند.
ویژگی این نرمافزار، فهمیدن و درک راحت متنهایی بود که بسیار کمرنگ و یا توسط مداد نوشته شده بودند و یا بر اثر گذشت زمان، از وضوحشان کاسته شده بود. در آن زمان، به دلیل وجود نداشتن نرمافزارهایی مثل Adobe Photoshop که بتوانند وضوح و contrast تصاویر را تنظیم کنند، بالا بردن کیفیت و ترمیم تصاویر قدیمی، تار و محوشده بسیار سخت بود و به آسانی انجام نمیگرفت.
همچنین سرویس پستی ایالات متحده، از سال ۱۹۵۶ شروع به استفاده از OCR کرده تا بتواند امور مربوط به ارسال و دریافت نامههای خود در سراسر دنیا را ساماندهی کند. با استفاده از فناوری تشخیص بصری متن، ادارات پست سراسر آمریکا به جای وارد کردن دستی یا تایپ اطلاعات مربوط به هر نامه، پاکتها و بستههای پستی را اسکن میکنند و اطلاعات مورد نیاز نیز به شکل خودکار توسط کامپیوتر فهمیده و ذخیره میشود. یاکوب رینبو، نخستین کسی بود که این سیستم را وارد ادارات پست و بانکهای آمریکایی کرد.
در حال حاضر هرچند نرمافزار رسمی و معتبری برای درک متون به زبانهای آسیای غربی و برخی زبانهای غیرلاتیندیگر وجود ندارد، اما جدیدترین حوزه تحقیق و گسترش نرمافزارهای OCR برای تشخیص حروف چسبان و شکسته لاتین به کار گرفته میشود.
در حال حاضر برای اکثر زبانهایی مانند فرانسوی، ایتالیایی، انگلیسی و آلمانی که از الفبای لاتین استفاده میکنند، نرمافزار تشخیص بصری کاراکترها وجود دارد و اشکالات رایج در آنها به دلیل وجود تفاوت در املای برخی از کلمات یا تفاوت الفبا نیز حل شده است.
به همین دلیل کارشناسان، به این حوزه روی آوردهاند که نرمافزارها را قادر سازند حروف چسبان، شکسته و خوشنویسی را درک کنند.
گفته میشود برخی از شرکتهای نرمافزاری در کشور ما نیز مشغول طراحی نرمافزار OCR فارسی هستند با این حال به نظر میرسد به دلیل پیچیدگیهای خاص موجود در نوشتار و الفبای فارسی و تعدد سبکهای نوشتاری فارسی برای اشخاص مختلف که حروف گوناگون را به اشکال متنوع تحریر میکنند، این کار تا مدتهای زیاد نیاز به تحقیق و مطالعه داشته باشد.
گزارش:سید ایمان ضیابری
منبع : روزنامه فناوران
ایران مسعود پزشکیان دولت چهاردهم پزشکیان مجلس شورای اسلامی محمدرضا عارف دولت مجلس کابینه دولت چهاردهم اسماعیل هنیه کابینه پزشکیان محمدجواد ظریف
پیاده روی اربعین تهران عراق پلیس تصادف هواشناسی شهرداری تهران سرقت بازنشستگان قتل آموزش و پرورش دستگیری
ایران خودرو خودرو وام قیمت طلا قیمت دلار قیمت خودرو بانک مرکزی برق بازار خودرو بورس بازار سرمایه قیمت سکه
میراث فرهنگی میدان آزادی سینما رهبر انقلاب بیتا فرهی وزارت فرهنگ و ارشاد اسلامی سینمای ایران تلویزیون کتاب تئاتر موسیقی
وزارت علوم تحقیقات و فناوری آزمون
رژیم صهیونیستی غزه روسیه حماس آمریکا فلسطین جنگ غزه اوکراین حزب الله لبنان دونالد ترامپ طوفان الاقصی ترکیه
پرسپولیس فوتبال ذوب آهن لیگ برتر استقلال لیگ برتر ایران المپیک المپیک 2024 پاریس رئال مادرید لیگ برتر فوتبال ایران مهدی تاج باشگاه پرسپولیس
هوش مصنوعی فناوری سامسونگ ایلان ماسک گوگل تلگرام گوشی ستار هاشمی مریخ روزنامه
فشار خون آلزایمر رژیم غذایی مغز دیابت چاقی افسردگی سلامت پوست