دانلود کتاب Adaptive Representations for Reinforcement Learning
49,000 تومان
نمایش های تطبیقی برای یادگیری تقویتی
| موضوع اصلی | کامپیوتر – علوم کامپیوتر |
|---|---|
| نوع کالا | کتاب الکترونیکی |
| ناشر | Springer-Verlag Berlin Heidelberg |
| تعداد صفحه | 116 / 127 |
| حجم فایل | 4.18 مگابایت |
| کد کتاب | 3642139310 , 9783642139314 |
| نوبت چاپ | 1 |
| نویسنده | Shimon Whiteson (auth.) |
|---|---|
| زبان | انگلیسی |
| فرمت | |
| سال انتشار | 2010 |
جدول کد تخفیف
| تعداد کتاب | درصد تخفیف | قیمت کتاب |
| 1 | بدون تخفیف | 25,000 تومان |
| 2 | 20 درصد | 20,000 تومان |
| 3 الی 5 | 25 درصد | 18,750 تومان |
| 6 الی 10 | 30 درصد | 17,500 تومان |
| 11 الی 20 | 35 درصد | 16,250 تومان |
| 21 الی 30 | 40 درصد | 15,000 تومان |
| 31 الی 40 | 45 درصد | 13,750 تومان |
| 41 الی 50 | 50 درصد | 12,500 تومان |
| 51 الی 70 | 55 درصد | 11,250 تومان |
| 71 الی 100 | 60 درصد | 10,000 تومان |
| 101 الی 150 | 65 درصد | 8,750 تومان |
| 151 الی 200 | 70 درصد | 7,500 تومان |
| 201 الی 300 | 75 درصد | 6,250 تومان |
| 301 الی 500 | 80 درصد | 5,000 تومان |
| 501 الی 1000 | 85 درصد | 3,750 تومان |
| 1001 الی 10000 | 90 درصد | 2,500 تومان |
This book presents new algorithms for reinforcement learning, a form of machine learning in which an autonomous agent seeks a control policy for a sequential decision task. Since current methods typically rely on manually designed solution representations, agents that automatically adapt their own representations have the potential to dramatically improve performance. This book introduces two novel approaches for automatically discovering high-performing representations. The first approach synthesizes temporal difference methods, the traditional approach to reinforcement learning, with evolutionary methods, which can learn representations for a broad class of optimization problems. This synthesis is accomplished by customizing evolutionary methods to the on-line nature of reinforcement learning and using them to evolve representations for value function approximators. The second approach automatically learns representations based on piecewise-constant approximations of value functions. It begins with coarse representations and gradually refines them during learning, analyzing the current policy and value function to deduce the best refinements. This book also introduces a novel method for devising input representations. This method addresses the feature selection problem by extending an algorithm that evolves the topology and weights of neural networks such that it evolves their inputs too. In addition to introducing these new methods, this book presents extensive empirical results in multiple domains demonstrating that these techniques can substantially improve performance over methods with manual representations.
ترجمه فارسی (ترجمه ماشینی)
این کتاب الگوریتمهای جدیدی را برای یادگیری تقویتی ارائه میکند، شکلی از یادگیری ماشین که در آن یک عامل مستقل به دنبال یک خط مشی کنترل برای یک کار تصمیمگیری متوالی است. از آنجایی که روشهای فعلی معمولاً بر نمایشهای راهحل طراحیشده دستی متکی هستند، عواملی که بهطور خودکار بازنماییهای خود را تطبیق میدهند، پتانسیل بهبود چشمگیر عملکرد را دارند. این کتاب دو رویکرد جدید را برای کشف خودکار نمایشهای با عملکرد بالا معرفی میکند. رویکرد اول روشهای تفاوت زمانی، رویکرد سنتی برای یادگیری تقویتی را با روشهای تکاملی ترکیب میکند، که میتواند نمایشهایی را برای کلاس وسیعی از مسائل بهینهسازی بیاموزد. این ترکیب با سفارشی کردن روشهای تکاملی به ماهیت آنلاین یادگیری تقویتی و استفاده از آنها برای تکامل نمایشهایی برای تقریبکنندههای تابع ارزش انجام میشود. رویکرد دوم به طور خودکار نمایش هایی را بر اساس تقریب های ثابت تکه ای توابع ارزش می آموزد. با نمایشهای درشت شروع میشود و به تدریج آنها را در طول یادگیری اصلاح میکند و خط مشی فعلی و تابع ارزش را برای استنباط بهترین اصلاحات تحلیل میکند. این کتاب همچنین یک روش جدید برای ابداع نمایش های ورودی معرفی می کند. این روش با گسترش الگوریتمی که توپولوژی و وزن شبکههای عصبی را به گونهای تغییر میدهد که ورودیهای آنها را نیز تکامل میدهد، مشکل انتخاب ویژگی را حل میکند. علاوه بر معرفی این روشهای جدید، این کتاب نتایج تجربی گستردهای را در حوزههای متعدد ارائه میکند که نشان میدهد این تکنیکها میتوانند عملکرد را نسبت به روشهایی با نمایش دستی به طور قابل ملاحظهای بهبود بخشند.

نقد و بررسیها
هنوز بررسیای ثبت نشده است.