بخش بندی و ردیابی لب با استفاده از سطوح همتراز مبتنی بر قیدپذیری شکلی و کاربرد آن در تشخیص هویت گوینده
(ندگان)پدیدآور
بنی مهد, رضاابراهیم نژاد صدیق, حسیننوع مدرک
Textزبان مدرک
فارسیچکیده
صحبت بشر طبیعتی چند وجهی داشته و شامل مولفه های صوتی و تصویری می باشد. در
تحقیقات اخیر نشان داده شده که ترکیب اطلاعاتی در مورد شکل لب ها ،در بازشناسی صحبت
صوتی ،قدرت سیستم را افزایش می دهد. در این مقاله الگوریتمی خودکار برای استخراج شکل
لب در یک توالی تصاویر ارائه می شود که در آن هیچگونه نشا نگذاری در تصاویر مورد نیاز
نبوده و در شرایط نور طبیعی نیز از کارایی مطلوبی برخوردار می باشد. در روش پبشنهادی
ابتدا یک مدل پارامتری در فریم اول براساس ویژگی فضای رنگی و با استفاده از قید منحنی Bsplineبرای لب ایجاد شده و سپس در فریم های بعدی این مدل بعنوان شرایط اولیه در سطوح همتراز مورد استفاده قرار می گیرد. همچنین در روش پبشنهادی هر مرحله از تغییرات
سطوح همتراز، قید شکلی با استفاده از چند نقطه کنترلی برای تعیین دقیق کانتور لب در نقاط
گوشه لب و پایین آن درنظر گرفته می شود. نتایج آزمایش نشان می دهد که روش پیشنهادی
از قدرت بخش بندی مطلوبی در مقایسه با حالتی (که فقط از اطلاعات رنگی برای سطوح
همتراز استفاده شده است) برخوردار بوده و نتایج آن به مدل واقعی لب نزدیک تر می باشد.
کلید واژگان
مدل پارامتریسطوح همتراز
ردیابی لب
شناسایی گوینده
بازشناسی گفتار
شماره نشریه
16تاریخ نشر
2011-09-231390-07-01




