بخش بندی و ردیابی لب با استفاده از سطوح همتراز مبتنی بر قیدپذیری شکلی و کاربرد آن در تشخیص هویت گوینده

بنی مهد, رضا; ابراهیم نژاد صدیق, حسین

(ندگان)پدیدآور

بنی مهد, رضاابراهیم نژاد صدیق, حسین

دریافت مدرک

FullText

اندازه فایل:

244.5کیلوبایت

نوع فايل (MIME):

PDF

نوع مدرک

Text

زبان مدرک

فارسی

نمایش کامل رکورد

چکیده

صحبت بشر طبیعتی چند وجهی داشته و شامل مولفه های صوتی و تصویری می باشد. در تحقیقات اخیر نشان داده شده که ترکیب اطلاعاتی در مورد شکل لب ها ،در بازشناسی صحبت صوتی ،قدرت سیستم را افزایش می دهد. در این مقاله الگوریتمی خودکار برای استخراج شکل لب در یک توالی تصاویر ارائه می شود که در آن هیچگونه نشا نگذاری در تصاویر مورد نیاز نبوده و در شرایط نور طبیعی نیز از کارایی مطلوبی برخوردار می باشد. در روش پبشنهادی ابتدا یک مدل پارامتری در فریم اول براساس ویژگی فضای رنگی و با استفاده از قید منحنی Bsplineبرای لب ایجاد شده و سپس در فریم های بعدی این مدل بعنوان شرایط اولیه در سطوح همتراز مورد استفاده قرار می گیرد. همچنین در روش پبشنهادی هر مرحله از تغییرات سطوح همتراز، قید شکلی با استفاده از چند نقطه کنترلی برای تعیین دقیق کانتور لب در نقاط گوشه لب و پایین آن درنظر گرفته می شود. نتایج آزمایش نشان می دهد که روش پیشنهادی از قدرت بخش بندی مطلوبی در مقایسه با حالتی (که فقط از اطلاعات رنگی برای سطوح همتراز استفاده شده است) برخوردار بوده و نتایج آن به مدل واقعی لب نزدیک تر می باشد.

کلید واژگان

مدل پارامتری
سطوح همتراز
ردیابی لب
شناسایی گوینده
بازشناسی گفتار

شماره نشریه

تاریخ نشر

2011-09-23
1390-07-01

ناشر

پلیس آگاهی ناجا

شاپا

1735-272X

URI

http://det.jrl.police.ir/article_10519.html
https://iranjournals.nlai.ir/handle/123456789/396746