دانلود کتاب Reinforcement Learning and Dynamic Programming Using Function Approximators (Automation and Control Engineering)
49,000 تومان
یادگیری تقویتی و برنامه نویسی پویا با استفاده از تقریبگرهای تابع (مهندسی اتوماسیون و کنترل)
| موضوع اصلی | کامپیوتر – علوم کامپیوتر |
|---|---|
| نوع کالا | کتاب الکترونیکی |
| تعداد صفحه | 280 / 275 |
| حجم فایل | 8.34 مگابایت |
| کد کتاب | 1439821097 , 9781439821091 |
| نوبت چاپ | 1 |
| نویسنده | Bart De Schutter, Damien Ernst, Lucian Busoniu, Robert Babuska |
|---|---|
| زبان | انگلیسی |
| فرمت | |
| سال انتشار | 2010 |
جدول کد تخفیف
| تعداد کتاب | درصد تخفیف | قیمت کتاب |
| 1 | بدون تخفیف | 25,000 تومان |
| 2 | 20 درصد | 20,000 تومان |
| 3 الی 5 | 25 درصد | 18,750 تومان |
| 6 الی 10 | 30 درصد | 17,500 تومان |
| 11 الی 20 | 35 درصد | 16,250 تومان |
| 21 الی 30 | 40 درصد | 15,000 تومان |
| 31 الی 40 | 45 درصد | 13,750 تومان |
| 41 الی 50 | 50 درصد | 12,500 تومان |
| 51 الی 70 | 55 درصد | 11,250 تومان |
| 71 الی 100 | 60 درصد | 10,000 تومان |
| 101 الی 150 | 65 درصد | 8,750 تومان |
| 151 الی 200 | 70 درصد | 7,500 تومان |
| 201 الی 300 | 75 درصد | 6,250 تومان |
| 301 الی 500 | 80 درصد | 5,000 تومان |
| 501 الی 1000 | 85 درصد | 3,750 تومان |
| 1001 الی 10000 | 90 درصد | 2,500 تومان |
ترجمه فارسی (ترجمه ماشینی)
از لوازم خانگی گرفته تا کاربردها در رباتیک، سیستم های مهندسی شده که شامل دینامیک پیچیده است، فقط می توانند به اندازه الگوریتم هایی که آنها را کنترل می کنند مؤثر باشند. در حالی که برنامهنویسی پویا (DP) راهی برای حل بهینه مسائل تصمیمگیری و کنترل مربوط به سیستمهای دینامیکی پیچیده در اختیار محققان قرار داده است، ارزش عملی آن توسط الگوریتمهایی که فاقد ظرفیت مقیاسسازی تا مسائل واقعی هستند، محدود شده است. با این حال، در سالهای اخیر، پیشرفتهای چشمگیر در یادگیری تقویتی (RL)، همتای بدون مدل DP، درک ما را از آنچه ممکن است تغییر داد. این پیشرفتها منجر به ایجاد روشهای قابل اعتمادی شد که میتوان آنها را حتی زمانی که یک مدل ریاضی از سیستم در دسترس نیست به کار برد، و به محققان این امکان را میدهد تا مسائل کنترل چالشبرانگیز را در مهندسی، و همچنین در رشتههای مختلف دیگر، از جمله اقتصاد، پزشکی، حل کنند. هوش مصنوعی یادگیری تقویتی و برنامه نویسی پویا با استفاده از تقریبگرهای تابع، کاوشی جامع و بی نظیر در زمینه RL و DP فراهم می کند. با تمرکز بر مسائل متغیر پیوسته، این متن اصلی به جزئیات تحولات اساسی میپردازد که در دهه گذشته این زمینه را بهطور اساسی تغییر دادهاند. در صفحات خود، متخصصان پیشگام، مقدمه ای مختصر بر RL و DP کلاسیک ارائه می کنند و به دنبال آن روش های پیشرفته و جدید در RL و DP با تقریب ارائه می شود. آنها با ترکیب توسعه الگوریتم با تضمین های نظری، کار خود را با مثال های گویا و مقایسه های روشنگر توضیح می دهند. سه فصل جداگانه به الگوریتم های نماینده از هر یک از کلاس های اصلی تکنیک ها اختصاص داده شده است: تکرار ارزش، تکرار خط مشی، و جستجوی خط مشی. ویژگی ها و عملکرد این الگوریتم ها در مطالعات تجربی گسترده بر روی طیف وسیعی از کاربردهای کنترل برجسته شده است. توسعه اخیر برنامه های کاربردی شامل سیستم های پیچیده منجر به افزایش علاقه به روش های RL و DP و نیاز متعاقب آن به یک منبع با کیفیت در مورد این موضوع شده است. برای دانشجویان فارغ التحصیل و سایر افراد تازه وارد در این زمینه، این کتاب مقدمه ای کامل بر اصول و روش های نوظهور ارائه می دهد. و برای آن دسته از محققین و دست اندرکارانی که در زمینه های کنترل بهینه و انطباقی، یادگیری ماشین، هوش مصنوعی و تحقیقات عملیاتی کار می کنند، این منبع ترکیبی از الگوریتم های عملی، تجزیه و تحلیل نظری و مثال های جامعی را ارائه می دهد که قادر به تطبیق و اعمال آن خواهند بود. به کار خودشون برای مطالب بیشتر، از جمله کد کامپیوتری مورد استفاده در مطالعات و اطلاعات مربوط به پیشرفت های جدید، به وب سایت نویسندگان به آدرس www.dcsc.tudelft.nl/rlbook/ مراجعه کنید.

نقد و بررسیها
هنوز بررسیای ثبت نشده است.