کاهش فضای جستجو برای بازشناسی زیرکلمات تایپی فارسی با استفاده از ویژگیهای ساده، کوانتیزاسیون ویژگی و ترکیب طبقهبندها
(ندگان)پدیدآور
میری, اسماعیلرضوی, سیّد محمّدمهرشاد, ناصرنوع مدرک
Textمقاله پژوهشی فارسی
زبان مدرک
فارسیچکیده
در این مقاله روشی برای کاهش فضای جستجو در بازشناسی زیرکلمات چاپی فارسی ارائه میشود. ابتدا 10 ویژگی ساده از زیرکلمه استخراج میشود. با استفاده از مفهوم کوانتیزاسیون و با توجه به بازه تغییرات هر ویژگی روی همه دادههای آموزشی ویژگیها کوانتیزه شده و به اعداد صحیحی تبدیل میشوند. با استفاده از هر ویژگی و فاصله آن تا ویژگی متناظر هر کدام از نمونههای آموزشی، به هر کلاس امتیازی داده میشود. با اعمال همه ویژگیها، هر کلاس به ازای هر ویژگی یک امتیاز دارد که با ترکیب این امتیازات با اعمال جبری یک امتیاز نهایی برای هر زیرکلمه بدست میآید که با مرتب کردن آنها و انتخاب تعدادی از آنها که امتیاز بیشتری دارند، فضای جستجو محدود میشود. از اعمال جبری جمع، ضرب، بیشینه، کمینه و جمع وزندار برای ترکیب امتیازات استفاده شده است. روش جمع وزن دار، که وزنهای بهینه با الگوریتم بهینهسازی جمعیت ذرات تعیین شدهاند، بهترین پاسخ را داده است.
کلید واژگان
بازشناسی زیرکلمات فارسیبهینهسازی جمعیت ذرات
ترکیب طبقهبندها
کاهش فضای جستجو
کوانتیزاسیون ویژگی
شماره نشریه
2تاریخ نشر
2020-07-221399-05-01
ناشر
دانشگاه صنعتی نوشیروانی بابلBabol Noshirvani University of Technology
سازمان پدید آورنده
دانشگاه بیرجنددانشکده مهندسی برق و کامپیوتر، دانشگاه بیرجند، بیرجند، ایران
دانشگاه بیرجند
شاپا
2383-10062588-4913




