| dc.contributor.author | درهمی, ولی | fa_IR |
| dc.contributor.author | اعلمی یان هرندی, فریناز | fa_IR |
| dc.date.accessioned | 1399-07-09T04:39:52Z | fa_IR |
| dc.date.accessioned | 2020-09-30T04:39:52Z | |
| dc.date.available | 1399-07-09T04:39:52Z | fa_IR |
| dc.date.available | 2020-09-30T04:39:52Z | |
| dc.date.issued | 2019-02-20 | en_US |
| dc.date.issued | 1397-12-01 | fa_IR |
| dc.date.submitted | 2019-03-05 | en_US |
| dc.date.submitted | 1397-12-14 | fa_IR |
| dc.identifier.citation | درهمی, ولی, اعلمی یان هرندی, فریناز. (1397). مروری بر روش های یادگیری تقویتی فازی با معماری نقاد-تنها. سیستم های فازی و کاربردها, 1(2), 11-34. | fa_IR |
| dc.identifier.uri | http://jfsa.fuzzy.ir/article_86075.html | |
| dc.identifier.uri | https://iranjournals.nlai.ir/handle/123456789/266094 | |
| dc.description.abstract | این مقاله به مرور روش های یادگیری تقویتی فازی با معماری نقاد-تنها م یپردازد .<br /> یادگیری تقویتی فازی از ترکیب سیستم های فازی به عنوان تقری بزننده ی جامع و روش یادگیری<br /> تقویتی حاصل شده است. یادگیری تقویتی یک روش یادگیری قوی است که تنها با استفاده<br /> از سیگنال عددی پاداش یا جریمه پارامترهای سیستم را به صورت برخط تنظیم می نماید. در<br /> معماری نقاد-تنها یک سیستم فازی مدل سوگنو مرتبه ی صفر برای تقریب تابع ارزش- عمل<br /> استفاده می شود و عمل نهایی بر اساس مقدار ارزش عمل های نامزد در تالی هر قاعده ی فازی<br /> و یادگیری (FQL) به دست می آید. در این مقاله دو روش پایه به نام های یادگیری کیو فازی<br /> برای تنظیم ارزش عمل های نامزد قواعد بیان می شود. در این دو روش (FSL) سارسای فازی<br /> به ترتیب از تعمیم روش های یادگیری کیو استاندارد و یادگیری سارسای استاندارد بهره برده شده<br /> وجود تحلیل های مثبت ریاضی درخصوصهمگرایی است FQL بر FSL است. مهمترین برتری<br /> و گسترش هایی از FSL و FQL وجود دارد. روش های FQL در حالی که مثال هایی از واگرایی در<br /> آنها در مسائل کنترلی زیادی همچون حرکت ربات، حرکت بازوی ربات، حرکت قایق، مسیریابی<br /> در شبکه های کامپیوتری، و کنترل نیروگاه بادی استفاده شده و کارآیی خود را نشان داده اند. | fa_IR |
| dc.format.extent | 8019 | |
| dc.format.mimetype | application/pdf | |
| dc.language | فارسی | |
| dc.language.iso | fa_IR | |
| dc.publisher | انجمن سیستم های فازی ایران | fa_IR |
| dc.relation.ispartof | سیستم های فازی و کاربردها | fa_IR |
| dc.subject | سیستم فازی | fa_IR |
| dc.subject | مدل سوگنوِ | fa_IR |
| dc.subject | قاعده ی فازی | fa_IR |
| dc.subject | یادگیری تقویتی | fa_IR |
| dc.subject | معماری نقاد-تنها | fa_IR |
| dc.title | مروری بر روش های یادگیری تقویتی فازی با معماری نقاد-تنها | fa_IR |
| dc.type | Text | en_US |
| dc.type | دعوت شده | fa_IR |
| dc.contributor.department | دانشگاه یزد، گروه مهندسی کامپیوتر | fa_IR |
| dc.contributor.department | دانشگاه یزد، گروه مهندسی کامپیوتر | fa_IR |
| dc.citation.volume | 1 | |
| dc.citation.issue | 2 | |
| dc.citation.spage | 11 | |
| dc.citation.epage | 34 | |