یکشنبه, ۱۶ دی, ۱۴۰۳ / 5 January, 2025
مجله ویستا
هر چه که بنویسی میفهمم!
از تایپ کردن خسته شدهاید؟ نمیتوانید مدت زمان زیادی را به نوشتن و دوباره تایپ کردن یک متن طولانی دانشگاهی یا گزارش خبریتان اختصاص دهید؟ میخواهید صفحات یک کتاب را اسکن کنید تا بتوانید قسمتهای مورد نیازش را حذف و برخی قسمتهای دیگر را برای ویرایش و تغییر انتخاب کنید اما وقت ندارید؟ نامهیی طولانی نوشتهاید اما آنقدر بدخط است که فقط خودتان میتوانید بخوانیدش و مجبورید دوباره تایپ کنید؟ پیشنهاد ما این است که از فناوری نوین و جالب OCR استفاده کنید.
فناوری تشخیص یا ادراک نوری حروف که از آن به عنوان Optical Character Recognition یا اختصاراً OCR نام میبرند، یکی از انواع نرمافزارهای کامپیوتری است که برای ترجمهی تصاویر حاوی دستنوشتهها یا تایپنوشتههای غالباً ثبتشده توسط اسکنر به متن و حروف قابل درک و فهم برای کامپیوتر استفاده میشود.
این فناوری از تشخیص قالب و الگو، هوش مصنوعی و چشم ماشینی استفاده میکند تا متنهایی که به صورت پرینتشده یا دستنوشته بر روی کاغذهای معمولی در اختیار داریم را به متنهای قابل ویرایش توسط نرمافزارهای ادیتور متن با کامپیوتر بدل نمایند.
معمولاً از OCR در زمانهایی استفاده میشود که فرصت زیادی برای تایپ کردن متون وجود ندارد و شما میخواهید به سرعت متنی را که به شکل دستنوشته با قلم یا خودکارهای معمولی روی کاغذ نوشتهاید، اسکن کنید تا بتوانید آن را به شکلهای مختلف، ویرایش متنی نمایید.
یکی دیگر از کاربردهای فناوری تشخیص بصری حروف در زمانی است که شما میخواهید متن مقالات، کتابها یا نوشتههای از قبل پرینتشدهیی را اسکن و مجدداً ویرایش و ارسال کنید که حجم زیادی دارند و ذخیرهسازی آنها در قالب فایلهای تصویری مثل JPEG یا GIF امکانپذیر نیست.
نرمافزارهای جدید OCR که غالباً از آنها در گوشیهای تلفن همراه یا کامپیوترهای قابل حمل مجهز به صفحههای لمسی و Padهای نوشتار با قلم نوری استفاده میشود، امکانی برای تمرین کردن دارند به این معنی که هر کاربر جدید، در مدت زمانی خاص متونی مشخصشده را با دستخط خود مینویسد و از طریق اسکنر یا Touch Pad به نرمافزار ارسال میکند تا سنسورهای مصنوعی و نرمافزاری بصری، با این دستخط آشنا شوند و بتوانند همواره آن را درک کنند.
مطمئناً ماشین یا کامپیوتر به عنوان یک دستگاه صرف، دارای هوش و ادراک انسانی نیست و نمیتواند متنهایی که به صورت دستخط به او داده میشود را درک کند. ضمن اینکه کامپیوتر، تمامی تصاویر ذخیرهشده با فرمتهای تصویری مثل Gif را تنها به عنوان یک تصویر میشناسد و هیچگاه محتویات آن را برای ویرایش درک نمیکند. به همین رو نیاز است تا در صورتی که از آن برای تشخیص دستخظ انسانی استفاده میشود، به مدتی خاص تحت تمرین قرار بگیرد.
نمونهی این تمرین برای افزایش هوش مصنوعی کامپیوتر را در مجموعهی تازه ارایهشدهی Office ۲۰۰۳ میتوانیم بیابیم جایی که در نرمافزارهایی مثل Word شما میتوانید فرمانهای صوتی را برای اجرای دستورهای و توابع مختلف به نرمافزار بدهید. برای این کار و افزایش بازدهی عملگر فرمان صوتی که بتواند دقیقتر و با درصد خطای کمتری کلام شما را متوجه شود، بخشی با عنوان Speech Training وجود دارد که در آن شما متنهای مشخصی را با صدای خودتان برای نرمافزار میخوانید و حافظهی مجازی نرمافزار نیز فرکانسها و بسامدهای صدای شما را ذخیره میکند و هر لغت جدیدی را که شما ادا کنید، بدون مشکل تشخیص میدهد.
با این تفاسیر میتوانیم خلاصه اینگونه جمعبندی کنیم که OCR برای تبدیل کردن تصاویر محو و مبهم به متنهای قابل درک و ویرایش مورد استفاده قرار میگیرد و اشکال گرافیکی را به کدهای ASCII و Unicode تبدیل میکند به شکلی که فونت، سایز، استیل، صفحهآرایی و تمام مختصات پاراگرافی آنها قابل ویرایش باشد.
● تاریخچه
در سال ۱۹۲۹ برای نخستین بار، گوستاو توشچک از آلمان، امتیازی برای اختراع خود با نام OCR دریافت کرد و از همان زمان، استارت طراحی نرمافزارهای هوشمند درک متن را زد.
اختراع او، یک دستگاه اسکنر نوری بود که یک سری الگوهای متنی آماده را در خود ذخیره میکرد و متنهایی که دریافت مینمود را در صورت تطابق کامل و تشابه بدون کم و کاست با الگوی ابتدایی ذخیرهشده، درک میکرد و به کامپیوتر میداد. ایراد اختراع او این بود که یک نمونهی از پیش تهیهشده شامل شکل کوچک و بزرگ حروف الفبا در اختیار داشت و در صورتی که متن ارایهشده به دستگاه کوچکترین تفاوتی با الگو و نمونهی آماده داشت، قادر به تشخیص نبود. با این حال، این کار سرآغاز ارایهی اختراعاتی شد که در آینده به تولید نرمافزارهای هوشمند تشخیص متن منجر شدند. در حال حاضر، این نرمافزارها برای درک متون تصویری به زبانهای مختلف طراحی شدهاند و نمونههای جدید آنها بر روی بسیاری از گوشیهای تلفن همراه نصب شده است.
اساس و پایهی کار قلمهای نوری یا Light penهایی که همراه با برخی گوشیهای تلفن همراه ارایه میشوند نیز همین فناوری است. زمانی که شما برای تایپ کردن متن یک پیام کوتاه یا شمارهگیری کردن، بدون در اختیار داشتن هیچ کیبوردی تنها به نوشتن معمولی اعداد و حروف با دستخط خاص خودتان مبادرت میکنید، یعنی در حال استفاده از ثمرات OCR هستید به شکلی که یک صفحهی کریستال مایع هوشمند به کمک قلم نوری، امکان درک و ردیابی کردن خطوط به ظاهر بیمعنی ترسیمشده توسط شما را فراهم میکند.
در سال ۱۹۵۰ دومین نمونهی نرمافزار تشخیص خط بصری کاراکترها توسط دیوید شپارد از سرویس جاسوسی سازمان نیروهای مسلح ایالات متحده طراحی شد. شپارد که متخصص رمزشکنی و باز کردن قفلهای مخفی اطلاعاتی و متنی بود، با همکاری یک پروفسور ژاپنی، نمونهیی از نرمافزار نوین OCR را طر احی کرد که نیازی به الگوی ثابت از پیشتعیینشده نداشت و به راحتی میتوانست دستخطهای افراد مختلف را درک کند. ویژگی این نرمافزار، فهمیدن و درک کردن راحت متنهایی بود که بسیار کمرنگ یا توسط مداد نوشته شده بودند و یا بر اثر گذشت زمان، از وضوحشان کاسته شده بود. در آن زمان، به دلیل وجود نداشتن نرمافزارهایی مثل Adobe Photoshop که بتوانند وضوح و contrast تصاویر را تنظیم کنند، بالا بردن کیفیت و ترمیم تصاویر قدیمی، تار و محوشده بسیار سخت بود و به آسانی انجام نمیگرفت.
همچنین سرویس پستی ایالات متحده، از سال ۱۹۵۶ شروع به استفاده از OCR کرده تا بتواند امور مربوط به ارسال و دریافت نامههای خود در سراسر دنیا را ساماندهی نماید. با استفاده از فناوری تشخیص بصری متن، ادارات پست سراسر آمریکا به جای وارد کردن دستی یا تایپ اطلاعات مربوط به هر نامه، پاکتها و بستههای پستی را اسکن میکنند و اطلاعات مورد نیاز نیز به شکل خودکار توسط کامپیوتر فهمیده و ذخیره میشود. یاکوب رینبو، نخستین کسی بود که این سیستم را وارد ادارات پست و بانکهای آمریکایی کرد.
در حال حاضر هرچند نرمافزار رسمی و معتبری برای درک متون به زبانهای آسیای غربی و برخی زبانهای غیرلاتیندیگر وجود ندارد، اما جدیدترین حوزهی تحقیق و گسترش نرمافزارهای OCR برای تشخیص حروف چسبان و شکستهی لاتین است. در حال حاضر برای اکثر زبانهایی مانند فرانسوی، ایتالیایی، انگلیسی، آلمانی و... که از الفبای لاتین استفاده میکنند، نرمافزار تشخیص بصری کاراکترها وجود دارد و اشکالات رایج در آنها به دلیل وجود تفاوت در املای برخی از کلمات یا تفاوت الفبا نیز حل شده است. به همین دلیل کارشناسان، به این حوزه روی آوردهاند که نرمافزارها را قادر سازند حروف چسبان، شکسته و خوشنویسی را درک کنند.
گفته میشود برخی از شرکتهای نرمافزاری در کشور ما نیز مشغول طراحی نرمافزار OCR فارسی هستند با این حال به نظر میرسد پیچیدگیهای خاص موجود در نوشتار و الفبای فارسی و تعدد سبکهای نوشتاری فارسی برای اشخاص مختلف که حروف گوناگون را به اشکال متنوع تحریر میکنند، این کار تا مدتهای زیاد نیاز به تحقیق و مطالعه داشته باشد.
کوروش ضیابری
ایران مسعود پزشکیان دولت چهاردهم پزشکیان مجلس شورای اسلامی محمدرضا عارف دولت مجلس کابینه دولت چهاردهم اسماعیل هنیه کابینه پزشکیان محمدجواد ظریف
پیاده روی اربعین تهران عراق پلیس تصادف هواشناسی شهرداری تهران سرقت بازنشستگان قتل آموزش و پرورش دستگیری
ایران خودرو خودرو وام قیمت طلا قیمت دلار قیمت خودرو بانک مرکزی برق بازار خودرو بورس بازار سرمایه قیمت سکه
میراث فرهنگی میدان آزادی سینما رهبر انقلاب بیتا فرهی وزارت فرهنگ و ارشاد اسلامی سینمای ایران تلویزیون کتاب تئاتر موسیقی
وزارت علوم تحقیقات و فناوری آزمون
رژیم صهیونیستی غزه روسیه حماس آمریکا فلسطین جنگ غزه اوکراین حزب الله لبنان دونالد ترامپ طوفان الاقصی ترکیه
پرسپولیس فوتبال ذوب آهن لیگ برتر استقلال لیگ برتر ایران المپیک المپیک 2024 پاریس رئال مادرید لیگ برتر فوتبال ایران مهدی تاج باشگاه پرسپولیس
هوش مصنوعی فناوری سامسونگ ایلان ماسک گوگل تلگرام گوشی ستار هاشمی مریخ روزنامه
فشار خون آلزایمر رژیم غذایی مغز دیابت چاقی افسردگی سلامت پوست