مروری بر روش های یادگیری تقویتی فازی با معماری نقاد-تنها

درهمی, ولی; اعلمی یان هرندی, فریناز

(ندگان)پدیدآور

درهمی, ولیاعلمی یان هرندی, فریناز

دریافت مدرک

FullText

اندازه فایل:

7.832 مگابایت

نوع فايل (MIME):

PDF

نوع مدرک

Text
دعوت شده

زبان مدرک

فارسی

نمایش کامل رکورد

چکیده

این مقاله به مرور روش های یادگیری تقویتی فازی با معماری نقاد-تنها م یپردازد . یادگیری تقویتی فازی از ترکیب سیستم های فازی به عنوان تقری بزننده ی جامع و روش یادگیری تقویتی حاصل شده است. یادگیری تقویتی یک روش یادگیری قوی است که تنها با استفاده از سیگنال عددی پاداش یا جریمه پارامترهای سیستم را به صورت برخط تنظیم می نماید. در معماری نقاد-تنها یک سیستم فازی مدل سوگنو مرتبه ی صفر برای تقریب تابع ارزش- عمل استفاده می شود و عمل نهایی بر اساس مقدار ارزش عمل های نامزد در تالی هر قاعده ی فازی و یادگیری (FQL) به دست می آید. در این مقاله دو روش پایه به نام های یادگیری کیو فازی برای تنظیم ارزش عمل های نامزد قواعد بیان می شود. در این دو روش (FSL) سارسای فازی به ترتیب از تعمیم روش های یادگیری کیو استاندارد و یادگیری سارسای استاندارد بهره برده شده وجود تحلیل های مثبت ریاضی درخصوصهمگرایی است FQL بر FSL است. مهمترین برتری و گسترش هایی از FSL و FQL وجود دارد. روش های FQL در حالی که مثال هایی از واگرایی در آنها در مسائل کنترلی زیادی همچون حرکت ربات، حرکت بازوی ربات، حرکت قایق، مسیریابی در شبکه های کامپیوتری، و کنترل نیروگاه بادی استفاده شده و کارآیی خود را نشان داده اند.

کلید واژگان

سیستم فازی
مدل سوگنوِ
قاعده ی فازی
یادگیری تقویتی
معماری نقاد-تنها

شماره نشریه

تاریخ نشر

2019-02-20
1397-12-01

ناشر

انجمن سیستم های فازی ایران

سازمان پدید آورنده

دانشگاه یزد، گروه مهندسی کامپیوتر
دانشگاه یزد، گروه مهندسی کامپیوتر

URI

http://jfsa.fuzzy.ir/article_86075.html
https://iranjournals.nlai.ir/handle/123456789/266094