تولید خودکار نوای گفتار به کمک مدل آمیختار عصبی-آماری با امکان انتخاب واحد در سنتز
(ندگان)پدیدآور
شیخان, منصورنوع مدرک
Textمقاله کامل پژوهشی
زبان مدرک
فارسیچکیده
در این مقاله با هدف ایجاد بهبود در عملکرد اولین ویرایش از سیستم تبدیل متن به گفتار طبیعی ارایه شده برای زبان فارسی، که در آن از یک شبکه عصبی بازگشتی برای تولید همزمان عوامل نوای گفتار (الگوی فرکانس گام، دیرش، انرژی و درنگ) و نیز سنتزکننده «مدل هارمونیک + نویز» با دادگان تک واحدی از دو واجی ها، برای تولید گفتار استفاده شده بود، چگونگی به کارگیری یک مدل آمیختار عصبی- آماری برای تولید نوا با ایجاد امکان انتخاب واحد در بخش سنتز گفتار بررسی شده است. در این راستا، در مدل آمیختار توسعه یافته برای تولید نوا، شبکه عصبی بازگشتی نقش پارامتری ساختن عوامل نوا (البته با تغییراتی در ساختار، نسبت به ویرایش اول سیستم) را داشته و به دنبال آن درخت های تصمیم گیری نوایی شکل گرفته و توصیف توزیع مقادیر نوا نیز به وسیله مدل مخلوط گوسی انجام شده است. بدین ترتیب امکان انتخاب قطعات گفتاری بهینه در یک سیستم سنتز مبتنی بر انتخاب واحد های هجایی و اتصال قطعات مناسب فراهم آمد. در ارزیابی نهایی عملکرد سیستم نیز با به کارگیری ملاک های ارایه شده در استاندارد MOS, ITU-T P.85 معادل 3.6 محاسبه شد.
کلید واژگان
نوای گفتارالگوی گام
دیرش
شبکه عصبی بازگشتی
درخت تصمیم گیری
مدل مخلوط گوسی
سنتز گفتار
انتخاب قطعه گفتاری
هجا
پردازش گفتار
شماره نشریه
3تاریخ نشر
2007-11-221386-09-01
ناشر
انجمن مهندسی پزشکی ایرانIranian Society for Biomedical Engineering
سازمان پدید آورنده
استادیار گروه مخابرات، دانشکدة فنی و مهندسی، واحد تهران جنوب دانشگاه آزاد اسلامیشاپا
5869-20089685-8006




