بهبود عملکرد حمله در تیم ربات‌های فوتبالیست با استفاده از یادگیری تقویتی

خاکسار, مینا; درهمی, ولی; رضائیان, مهدی

(ندگان)پدیدآور

خاکسار, مینادرهمی, ولیرضائیان, مهدی

دریافت مدرک

FullText

اندازه فایل:

929.6کیلوبایت

نوع فايل (MIME):

PDF

نوع مدرک

Text

زبان مدرک

فارسی

نمایش کامل رکورد

چکیده

به‌دلیل عدم امکان پیش‌بینی همه وضعیت‌های ممکن برای عامل‌ها در یک سیستم چندعامله‌ی پویا و گسترده، روش‌های یادگیری ماشین، ابزار مناسبی برای کنترل رفتار عامل‌ها می‌باشد. فوتبال شبیه‌سازی شده ربات‌ها یک مسئله شناخته‌شده برای ارزیابی الگوریتم‌های یادگیری ماشین روی سیستم‌های چندعامله است. در این مقاله الگوریتم یادگیری کیو ـ وی (یکی از الگوریتم‌های معروف یادگیری تقویتی) جهت بهبود عملکرد حمله در تیم ربات‌های فوتبالیست دو بعدی بکار گرفته شده‌است. سیگنال تقویتی براساس اینکه بازیکنانی که در حمله دخالت دارند، توپ را جلوی دروازه می‌رسانند، یا اینکه توپ را از دست می‌دهند، تعریف شده‌است و به‌ترتیب عامل‌ها با توجه به وضعیت ذکرشده، جایزه و جریمه دریافت می‌کنند. جهت بهبود عملکرد از ایده تقسیم سیگنال تقویتی متناسب با مقدار خبرگی عامل‌ها در یک سیستم چندعامله استفاده شده‌است. در اینجا میزان خبرگی متناسب با تفاوت ارزش عملِ با بالاترین ارزش با ارزشِ عملِ با کمترین مقدار ارزش در هر حالت تعریف می‌شود. نتایج شبیه‌سازی نشان می‌دهد، بهره‌گیری از ایده تقسیم سیگنال تقویتی براساس خبرگی در آموزش باعث افزایش سرعت در آموزش و بهبود عملکرد عامل‌ها شده‌است.

کلید واژگان

فوتبال شبیه‌سازی‌شده ربات‌ها
یادگیری تقویتی
یادگیری کیو ـ وی
سیستم‌های چندعامله
حمله

شماره نشریه

تاریخ نشر

2018-08-23
1397-06-01

ناشر

رئیس دانشکده مهندسی برق و کامپیوتر
Faculty of Electrical & Computer Engineering

سازمان پدید آورنده

دانشگاه یزد - پردیس فنی و مهندسی - گروه مهندسی کامپیوتر
دانشگاه یزد - پردیس فنی و مهندسی - گروه مهندسی کامپیوتر
دانشگاه یزد - پردیس فنی و مهندسی - گروه مهندسی کامپیوتر

شاپا

2008-7799
2538-3051

URI

https://tjee.tabrizu.ac.ir/article_7939.html
https://iranjournals.nlai.ir/handle/123456789/108996