طراحی و ضبط پایگاهدادگان گفتاری برای سیستمهای تبدیل متن به گفتار فارسی
(ندگان)پدیدآور
طاهری اردلی, مرتضیخرم, سهیلعاصی, مصطفیصامتی, حسینبی جن خان, محمودنوع مدرک
Textمقاله علمی - پژوهشی
زبان مدرک
فارسیچکیده
مقالة حاضر به ارائة روشی برای طراحی و ساختِ پایگاهدادگانی مختص سیستمهای تبدیل متن به گفتار با در نظر گرفتن ساخت نوایی فارسی میپردازد. این مجموعه به لحاظ آوایی و نوایی غنی و مشتمل بر 2826 نمونه جملة فارسی است. این نمونه جملات در شرایط استودیو و با تکصدای گویندة خانم که به صورت حرفهای در زمینة صدا فعالیت میکند ضبط شده است. پوشش حالتهای مختلف نوایی در کنار پوشش حالتهای مختلف آوایی از نقاط قوت این پایگاه است که برای نخستین بار در سیستمهای تبدیل متن به گفتارِ فارسی لحاظ میشود. این مجموعه در کنار فایلهای صوتی، دارای برچسبهای متن و صورت آوایی است که به صورت دستی اصلاح شدهاند. در نهایت، با بکارگیری مجموعه دادگان مذکور و با استفاده از روش بازسازی گفتار آماری ـ پارامتری ساخت صدا انجام گرفت. آزمودنیها کیفیت صدای ساختهشده را با استفاده از معیار میانگینِ امتیازاتِ نظردهی (MOS) 4.3 ارزیابی کردند.
کلید واژگان
پایگاهدادگان گفتاریتبدیل متن به گفتار
نوای گفتار
پیکرة متنی
پژوهش های توصیفی زبان شناسی
شماره نشریه
12تاریخ نشر
2016-09-221395-07-01
ناشر
دانشگاه بوعلی سیناسازمان پدید آورنده
استادیار گروه زبان انگلیسی دانشگاه شهرکردپژوهشگر/دانشگاه صنعتی شریف
استاد/پژوهشگاه علوم انسانی و مطالعات فرهنگی
استاد/دانشگاه صنعتی سریف
استاد/دانشگاه تهران
شاپا
2252-07402322-4975




