بهبود شبکه عمیق R-FCN در آشکارسازی و برچسبزنی اشیاء
(ندگان)پدیدآور
قنبری سرخی, علیحسن پور, حمیدفاتح, منصورنوع مدرک
Textمقاله پژوهشی
زبان مدرک
فارسیچکیده
امروزه آشکارسازی و برچسبزنی اشیاء در تصاویر یکی از چالشهای اساسی در برخی از کاربردهای بیناییماشین میباشد. در سالهای اخیر استفاده از یادگیری عمیق مورد توجه محققان قرار گرفته است. در همین راستا، در این مقاله ابتدا جدیدترین شبکههای عمیق موجود معرفی، سپس نقاط قوت و ضعف آنها تحلیل میشود. در ادامه شبکهای بهبود یافته از شبکه R-FCN ارائه میشود. روش پیشنهادی بر پایه معماری ResNet و شبکه تمام کانولوشن است. در این روش، معماری جدیدی مبتنی بر شبکه عمیق برای پیشنهاد ناحیه کاندید و روشی ترکیبی مبتنی بر SVMفازی دوکلاسه و SVR برای آشکارسازی و برچسبزنی اشیاء ارائه شده است. در این روش از تابع زیان جدید با عنوان اختلاف کوشی-شوارتز استفاده شده است. این تابع زیان از لحاظ سرعت و دقت، عملکرد بهتری از خود نشان داده است. روش پیشنهادی با معماری 101-ResNet بر روی مجموعه داده SUN برای آشکارسازی و برچسبزنی 36 شی مورد آزمایش قرار گرفت و نتایج بدست آمده نشان دهنده بهبود عملکرد این روش نسبت به روش پایه شبکه R-FCN است. روش پیشنهادی از لحاظ معیار mAP، عملکرد 48/38% و مدت زمان متوسط برای هر تصویر 0/13 را دارد، و نسبت به بهترین روش در این حوزه تقریبا 2% در عملکرد و 0/4 ثانیه در زمان بهتر عمل کرده است.
کلید واژگان
آشکارسازی و شناسایی اشیاءیادگیری عمیق
R-FCN
ماشین بردار پشتیبان دودویی فازی
اختلاف کوشی-شوارتز
شماره نشریه
2تاریخ نشر
2020-02-201398-12-01
ناشر
انجمن ماشین بینایی و پردازش تصویر ایرانIranian Society of Machine Vision and Image Processing
سازمان پدید آورنده
دانشجوی دکتری مهندسی کامپیوتر، دانشگاه صنعتی شاهروددانشکده مهندسی کامپیوتر، دانشگاه صنعتی شاهرود
دانشکده مهندسی کامپیوتر، دانشگاه صنعتی شاهرود




