تولید خودکار نوای گفتار به کمک مدل آمیختار عصبی-آماری با امکان انتخاب واحد در سنتز

شیخان, منصور

doi:https://dx.doi.org/10.22041/ijbme.2007.13501

(ندگان)پدیدآور

شیخان, منصور

دریافت مدرک

FullText

اندازه فایل:

336.5کیلوبایت

نوع فايل (MIME):

PDF

نوع مدرک

Text
مقاله کامل پژوهشی

زبان مدرک

فارسی

نمایش کامل رکورد

چکیده

در این مقاله با هدف ایجاد بهبود در عملکرد اولین ویرایش از سیستم تبدیل متن به گفتار طبیعی ارایه شده برای زبان فارسی، که در آن از یک شبکه عصبی بازگشتی برای تولید همزمان عوامل نوای گفتار (الگوی فرکانس گام، دیرش، انرژی و درنگ) و نیز سنتزکننده «مدل هارمونیک + نویز» با دادگان تک واحدی از دو واجی ها، برای تولید گفتار استفاده شده بود، چگونگی به کارگیری یک مدل آمیختار عصبی- آماری برای تولید نوا با ایجاد امکان انتخاب واحد در بخش سنتز گفتار بررسی شده است. در این راستا، در مدل آمیختار توسعه یافته برای تولید نوا، شبکه عصبی بازگشتی نقش پارامتری ساختن عوامل نوا (البته با تغییراتی در ساختار، نسبت به ویرایش اول سیستم) را داشته و به دنبال آن درخت های تصمیم گیری نوایی شکل گرفته و توصیف توزیع مقادیر نوا نیز به وسیله مدل مخلوط گوسی انجام شده است. بدین ترتیب امکان انتخاب قطعات گفتاری بهینه در یک سیستم سنتز مبتنی بر انتخاب واحد های هجایی و اتصال قطعات مناسب فراهم آمد. در ارزیابی نهایی عملکرد سیستم نیز با به کارگیری ملاک های ارایه شده در استاندارد MOS, ITU-T P.85 معادل 3.6 محاسبه شد.

کلید واژگان

نوای گفتار
الگوی گام
دیرش
شبکه عصبی بازگشتی
درخت تصمیم گیری
مدل مخلوط گوسی
سنتز گفتار
انتخاب قطعه گفتاری
هجا
پردازش گفتار

شماره نشریه

تاریخ نشر

2007-11-22
1386-09-01

ناشر

انجمن مهندسی پزشکی ایران
Iranian Society for Biomedical Engineering

سازمان پدید آورنده

استادیار گروه مخابرات، دانشکدة فنی و مهندسی، واحد تهران جنوب دانشگاه آزاد اسلامی

شاپا

5869-2008
9685-8006

URI

https://dx.doi.org/10.22041/ijbme.2007.13501
http://www.ijbme.org/article_13501.html
https://iranjournals.nlai.ir/handle/123456789/85380