پنجشنبه, ۹ اسفند, ۱۴۰۳ / 27 February, 2025
مجله ویستا

یک روش دو مرحله‌ای برای بازشناسی زیر- کلمات چاپی


یک روش دو مرحله‌ای برای بازشناسی زیر- کلمات چاپی
در این مقاله یک روش دو مرحله ای برای طبقه بندی زیر- کلمات چاپی فارسی ارائه شده است. زیر- کلمات چاپی با استفاده از ویژگیهای مکان مشخصه و روش k- میانگین، به ۳۰۰ خوشه تقسیم شده‌اند. از میانگین ویژگیهای زیر- کلمات هر خوشه به عنوان نماینده آن خوشه استفاده شده است. برای یک زیر- کلمه ورودی، در مرحله اول با استفاده از ویژگیهای مکان مشخصه و فاصله اقلیدسی از میانگین خوشه ها، طبقه بندی اولیه به ۳۰۰ خوشه انجام میشود و ۱۰ خوشه نزدیکتر تعیین میشوند. در مرحله دوم با استفاده از توصیفگرهای فوریه کانتور، زیر- کلمه ورودی به اعضای این ۱۰ خوشه طبقه بندی میشود.
مجموعه تمرین شامل زیر- کلمات متداول فارسی برای چهار قلم لوتوس، میترا، زر و یاقوت و سه اندازه ۱۰، ۱۲ و ۱۴ است.
در این تحقیق از بدنه های بدون نقطه ۱۲۷۰۰ زیر- کلمه متداول فارسی به عنوان مجموعه تمرین استفاده شده است. در یک آزمایش برای ارزیابی طبقه بندی از مجموعه ای شامل ۵۰۰ زیر- کلمه استفاده شد. با احتساب اولین انتخاب، پنج انتخاب اول و ده انتخاب اول به ترتیب ۴۰/۷۱%، ۹۵% و ۲۰/۹۸% از این زیر- کلمات به درستی طبقه‎بندی شدند. در مرحله پس پردازش از نوع و ترتیب نقاط زیر- کلمات برای بهبود بازشناسی آنها استفاده شد. در یک آزمایش برای بازشناسی یک مجموعه ۵۰۰ زیر- کلمه ای، در انتخاب اول ۶۰/۹۲% از آنها به درستی بازشناسی شدند.
افشین ابراهیمی
احسان اله کبیر
منبع : آموزش فناوری اطلاعات