بهبود سرعت آموزش در مسائل یادگیری تقویتی مبتنی بر انتقال دانش عصبیفازی
(ندگان)پدیدآور
سعادت جو, فاطمهقندهاری, عرفاننوع مدرک
Textزبان مدرک
فارسیچکیده
این مقاله به موضوع انتقال یادگیری در محیطهایی که بعضی از ویژگیهای آن مشترک است میپردازد. چالش اصلی در این مبحث، نحوه انتقال دانش بهدستآمده از محیط مبدأ به محیط مقصد است. در ایده ارائهشده با در نظرگرفتن ویژگیهای مشترک در فضای عامل بین دو محیط، ابتدا مقدار ارزش - عمل در محیط مبدأ بهدست میآید، سپس از یک شبکه عصبی- فازی برای تقریب مقدار تابع ارزش - عمل بهره برده میشود. در محیط مقصد، مقدار ارزش - عمل از ترکیب مقدار پیشبینی شبکه عصبی - فازی و مقدار بهدستآمده در خود آن محیط استفاده میشود. بهعبارت دیگر با توجه به آموزش انجامشده در محیط مبدأ، مقادیر ارزش - عمل در محیط مقصد از ترکیب مقادیر ارزش - عمل تقریبزدهشده توسط شبکه عصبی - فازی و مقدار بهدست آمده از الگوریتم یادگیری در آن محیط بهدست میآید. شایان ذکر است که از الگوریتم یادگیری Q در محیط استفادهشده است. نتایج حاصل از ایده ارائهشده، حاکی از افزایش چشمگیر سرعت یادگیری میباشد.
کلید واژگان
یادگیری تقویتیانتقال دانش
ویژگی مشترک
شبکه عصبی- فازی
شماره نشریه
3تاریخ نشر
2019-11-221398-09-01
ناشر
رئیس دانشکده مهندسی برق و کامپیوترFaculty of Electrical & Computer Engineering
سازمان پدید آورنده
دانشکده مهندسی کامپیوتر - دانشگاه علم و هنردانشکده مهندسی کامپیوتر - دانشگاه علم و هنر
شاپا
2008-77992538-3051




