کاهش فضای جستجو برای بازشناسی زیرکلمات تایپی فارسی با استفاده از ویژگی‌های ساده، کوانتیزاسیون ویژگی و ترکیب طبقه‌بندها

میری, اسماعیل; رضوی, سیّد محمّد; مهرشاد, ناصر

(ندگان)پدیدآور

میری, اسماعیلرضوی, سیّد محمّدمهرشاد, ناصر

دریافت مدرک

FullText

اندازه فایل:

1004.کیلوبایت

نوع فايل (MIME):

PDF

نوع مدرک

Text
مقاله پژوهشی فارسی

زبان مدرک

فارسی

نمایش کامل رکورد

چکیده

در این مقاله روشی برای کاهش فضای جستجو در بازشناسی زیرکلمات چاپی فارسی ارائه می‌شود. ابتدا 10 ویژگی ساده از زیرکلمه استخراج می‌شود. با استفاده از مفهوم کوانتیزاسیون و با توجه به بازه تغییرات هر ویژگی روی همه داده‌های آموزشی ویژگی‌ها کوانتیزه شده و به اعداد صحیحی تبدیل می‌شوند. با استفاده از هر ویژگی و فاصله آن تا ویژگی متناظر هر کدام از نمونه‌های آموزشی، به هر کلاس امتیازی داده می‌شود. با اعمال همه ویژگی‌ها، هر کلاس به ازای هر ویژگی یک امتیاز دارد که با ترکیب این امتیازات با اعمال جبری یک امتیاز نهایی برای هر زیرکلمه بدست می‌آید که با مرتب کردن آنها و انتخاب تعدادی از آنها که امتیاز بیشتری دارند، فضای جستجو محدود می‌شود. از اعمال جبری جمع، ضرب، بیشینه، کمینه و جمع وزن‌دار برای ترکیب امتیازات استفاده شده است. روش جمع وزن دار، که وزن‌های بهینه با الگوریتم بهینه‌سازی جمعیت ذرات تعیین شده‌اند، بهترین پاسخ را داده است.

کلید واژگان

بازشناسی زیرکلمات فارسی
بهینه‌سازی جمعیت ذرات
ترکیب طبقه‌بندها
کاهش فضای جستجو
کوانتیزاسیون ویژگی

شماره نشریه

تاریخ نشر

2020-07-22
1399-05-01

ناشر

دانشگاه صنعتی نوشیروانی بابل
Babol Noshirvani University of Technology

سازمان پدید آورنده

دانشگاه بیرجند
دانشکده مهندسی برق و کامپیوتر، دانشگاه بیرجند، بیرجند، ایران
دانشگاه بیرجند

شاپا

2383-1006
2588-4913

URI

http://jscit.nit.ac.ir/article_103458.html
https://iranjournals.nlai.ir/handle/123456789/195454