بازشناسی مقاوم گفتار با استفاده از شبکههای عصبی حافظه کوتاهمدت ماندگار و ویژگیهای گلوگاه
(ندگان)پدیدآور
معاون جولا, امیناکبری, احمدناصر شریف, بابکنوع مدرک
Textزبان مدرک
فارسیچکیده
شبکههای عصبی عمیق در سالهای اخیر به طرز گستردهای در سیستمهای بازشناسی گفتار مورداستفاده قرارگرفتهاند. بااینوجود، مقاومسازی این مدلها در حضور نویز محیط کمتر موردبررسی قرارگرفته است. در این مقاله دو راهکار برای مقاومسازی مدلهای شبکه حافظه کوتاهمدت ماندگار نسبت به نویز جمعپذیر محیطی موردبررسی قرارگرفته است. راهکار اول افزایش مقاومت مدلهای شبکه حافظه کوتاهمدت ماندگار نسبت به حضور نویز است که با توجه بهخصوصیت این شبکهها در یادگیری رفتار بلندمدت نویز ارائه میشود. بدین منظور پیشنهاد میشود از گفتار نویزی برای آموزش مدلها استفاده شود تا بهصورت آگاه به نویز آموزش ببینند. نتایج روی مجموعه داده نویزی شده TIMIT نشان میدهد که اگر مدلها بهجای گفتار تمیز با گفتار نویزی آموزش ببینند، دقت بازشناسی تا 18 درصد بهبود خواهد یافت. راهکار دوم کاهش تأثیر نویز بر ویژگیهای استخراجشده با استفاده از شبکه خود رمزگذار کاهنده نویز و استفاده از ویژگیهای گلوگاه بهمنظور فشردهسازی بردار ویژگی و بازنمایی سطح بالاتر ویژگیهای ورودی است. این راهکار باعث میشود مقاومت ویژگیها نسبت به نویز بیشتر شده و درنتیجه دقت سیستم بازشناسی پیشنهادشده در راهکار اول، در حضور نویز 4 درصد افزایش یابد.
کلید واژگان
بازشناسی گفتارمقاومت نسبت به نویز
دادههای چند شرطی
شبکه خود رمزگذار
شبکه حافظه کوتاهمدت ماندگار
شماره نشریه
3تاریخ نشر
2019-11-221398-09-01
ناشر
رئیس دانشکده مهندسی برق و کامپیوترFaculty of Electrical & Computer Engineering
سازمان پدید آورنده
دانشکده مهندسی کامپیوتر - دانشگاه علم و صنعتدانشکده مهندسی کامپیوتر - دانشگاه علم و صنعت
دانشکده مهندسی کامپیوتر - دانشگاه صنعتی خواجهنصیرالدین طوسی
شاپا
2008-77992538-3051




