مروری بر پژوهشهای لبخوانی خودکار:دادگان و روشها
(ندگان)پدیدآور
هدایتی پور, مهساشکفته, یاسرابراهیمی مقدم, محسننوع مدرک
Textمقاله مروری
زبان مدرک
فارسیچکیده
لبخوانی یا فرآیند بازشناسی دیداری گفتار روش تشخیص گفتار از روی حرکات لب گوینده است. در سالهای اخیر علاقه به لبخوانی خودکار رو به افزایش بوده و تحقیقات بسیاری در این زمینه انجام شده است و همچنان به عنوان یک موضوع تحقیقی پیشرو مطرح است. در این مقاله مروری بر تحقیقات انجام شده در زمینه لبخوانی خودکار ارائه شده است. فهرستی از پایگاه دادههای مورد استفاده با در نظر گرفتن خصوصیاتی نظیر تعداد گوینده، محتوای گفتار و کیفیت تصاویر ارائه شده است. در این مقاله، تحقیقات متنوع لبخوانی در زمینه تشخیص اعداد، حروف، کلمات و جملات و روشهای سنتی استخراج ویژگی و دستهبندی تا روشهای جدید مبتنی بر یادگیری عمیق مرور شدهاند. بعلاوه فعالیتهای لبخوانی زبان فارسی شامل پایگاه دادههای فراهم شده و تحقیقات مرتبط با جامعیت بیشتر معرفی شده است.
کلید واژگان
لبخوانیبازشناسی دیداری گفتار
استخراج ویژگی
یادگیری ماشینی
یادگیری عمیق
شناسایی الگو
شماره نشریه
4تاریخ نشر
2022-12-221401-10-01
ناشر
انجمن ماشین بینایی و پردازش تصویر ایرانIranian Society of Machine Vision and Image Processing
سازمان پدید آورنده
دانشآموخته کارشناسی ارشد مهندسی کامپیوتر گرایش هوش مصنوعی و رباتیکز، دانشگاه شهید بهشتی، تهران، ایرانگروه هوش مصنوعی رباتیک و رایانش شناختی ، دانشکده مهندسی و علوم کامپیوتر، دانشگاه شهید بهشتی، تهران، ایران
گروه هوش مصنوعی رباتیک و رایانش شناختی ، دانشکده مهندسی و علوم کامپیوتر، دانشگاه شهید بهشتی، تهران، ایران