استفاده از بازنمایی تنک و الگوریتم یادگیری ماشینی در آشکارساز فعالیت گفتار
(ندگان)پدیدآور
اسحاقی, محدثهنوع مدرک
Textمقاله پژوهشی
زبان مدرک
فارسیچکیده
در این مقاله یک آشکارساز فعالیت گفتار بر مبنای بازنمایی تنک و آموزش لغتنامه در فضای دو بعدی طیفی-زمانی ارائه شده است. مؤلفه های فضای طیفی-زمانی علاوه بر ابعاد فرکانس و زمان، دارای دو بعد دیگر مقیاس و نرخ هستند. در سالهای اخیر، استفاده از بازنمایی تنک و الگوریتم های یادگیری ماشینی در آموزش لغت نامه ها، جداسازی بهتر قسمت های گفتار و نویز را در پی داشته است. ایده اصلی در این روش، بازسازی هر سیگنال گفتار با استفاده از تعداد محدودی اتم های پایه است. در این الگوریتم با استفاده از فضای دو بعدی طیفی-زمانی و با کمک بازنمایی تنک، لغت نامه هایی با اندازه اتم های متفاوت حاصل شده که با روشهای یادگیری K-SVD و NMF آموزش داده می شوند. عملکرد این آشکارساز فعالیت گفتار در گفتار فارسی وانگلیسی ارزیابی شد. بطور مثال نتایج عملکرد این آشکارساز پیشنهادی در SNRهای بیشتر از 0 در گفتار انگلیسی برای نویر سفید و ماشین بیشتر از71/92 درصد و 82/91 درصد و برای گفتار فارسی بیشتر از 90 درصد می باشد که عملکرد خوب آشکارساز فعالیت گفتار پیشنهادی نسبت به سایر روشها را نشان میدهد.
کلید واژگان
آشکارساز فعالیت گفتارفضای دو بعدی طیفی-زمانی
بازنمایی تنک
الگوریتم یادگیری ماشینی
شماره نشریه
1تاریخ نشر
2022-03-211401-01-01
ناشر
دانشگاه قمQom University