ویژگیهای آگاه به محتوا برای قطعهبندی معنایی تصویر
(ندگان)پدیدآور
نصیری, مجیدرشیدی کنعان, حمیدرضاامیری, سید حمیدنوع مدرک
Textمقاله پژوهشی
زبان مدرک
فارسیچکیده
قطعه بندی معنایی تصویر مبتنی بر شبکه های عصبی عمیق، از رویکردهای مهم محققان بینایی ماشین می باشد. در روش های مبتنی بر شبکه های عصبی عمیق، بطور کلی از یک شبکه پایه که برای کاربرد شناسایی تصویر، آموزش دیده است، بمنظور استخراج ویژگی از تصویر استفاده میشود. از آنجا که ابعاد ویژگی های خروجی از این شبکه های پایه کوچکتر از تصویر ورودی می باشد، لذا با اضافه کردن چندین لایه کانولوشنی به انتهای این شبکه های پایه، ابعاد ویژگیهای خروجی از این شبکه ها را به اندازه ابعاد تصویر ورودی میرسانند. استفاده از ویژگی های محلی خروجی از شبکه های پایه، بدون در نظر گرفتن ارتباط کلی بین این ویژگی های محلی، منجر به قطعه بندی ضعیف و ناهموار می شود. بر این اساس، در این تحقیق واحدی با نام "واحد ویژگیهای آگاه به محتوا" پیشنهاد می شود. این واحد با کمک ویژگی های محلی خروجی از شبکه های پایه، ویژگی های سطح-تصویر ایجاد می کند. واحد پیشنهادی را میتوان در معماری های مختلف قطعه بندی معنایی تصویر قرار داد. در این تحقیق، با اضافه کردن واحد پیشنهادی CAF به معماریهای پایه FCN و DeepLab-v3-plus، به ترتیب معماریهای FCN-CAF و DeepLab-v3-plus-CAF پیشنهاد شده است. بمنظور آموزش معماریهای پیشنهادی از دادگان PASCAL VOC2012 استفاده شده است. نتایج آزمایش ها نشان می دهد که معماریهای پیشنهادی نسبت به معماریهای پایه مربوطه، به ترتیب 7/2 و 81/1درصد بهبود دقت (mIoU) دارد.
کلید واژگان
قطعه بندی معنایی تصویرشبکه های عصبی عمیق
شبکه های عصبی کانولوشنی
واحد ویژگی های آگاه به محتوا
شماره نشریه
1تاریخ نشر
2020-08-221399-06-01
ناشر
انجمن ماشین بینایی و پردازش تصویر ایرانIranian Society of Machine Vision and Image Processing
سازمان پدید آورنده
دانش آموخته کارشناسی ارشد هوش مصنوعی دانشگاه شهید رجاییدانشکده مهندسی کامپیوتر، دانشگاه شهید رجایی
دانشکده مهندسی کامپیوتر، دانشگاه تربیت دبیر شهید رجایی، تهران، ایران




