دانلود کتاب Algorithms for Reinforcement Learning

49,000 تومان

الگوریتم های یادگیری تقویتی


موضوع اصلی کامپیوتر – علوم کامپیوتر
نوع کالا کتاب الکترونیکی
ناشر Morgan & Claypool
تعداد صفحه 103
حجم فایل 1.60 مگابایت
کد کتاب 1608454924 , 9781608454921
نویسنده
زبانانگلیسی
فرمتPDF
سال انتشار2010
مطلب پیشنهادی: با پول کتاب در ایران چی میشه خرید؟
در صورت نیاز به تبدیل فایل به فرمت‌های PDF، EPUB، AZW3، MOBI و یا DJVU می‌توانید به پشتیبان اطلاع دهید تا در صورت امکان، فایل مورد نظر را تبدیل نمایند. سایت بَلیان دارای تخفیف پلکانی است، یعنی با افزودن کتاب بیشتر به سبدخرید، قیمت آن برای شما کاهش می‌یابد. جهت مشاهده درصد تخفیف‌ها بر روی «جدول تخفیف پلکانی» در پایین کلیک نمایید. جهت یافتن سایر کتاب‌های مشابه، از منو جستجو در بالای سایت استفاده نمایید.
شما می‌توانید با هر 1000 تومان خرید، ۱ شانس شرکت در قرعه‌کشی کتابخانه دیجیتال بلیان دریافت کنید و شانس خود را برای برنده شدن جوایز هیجان انگیز امتحان کنید. «شرایط شرکت در قرعه‌کشی»

جدول کد تخفیف

با افزودن چه تعداد کتاب به سبد‌خرید، چند‌ درصد تخفیف شامل آن خواهد شد؟ در این جدول پاسخ این سوال را خواهید یافت. برای مثال: اگر بین ۳ الی ۵ کتاب را در سبد خرید خود قرار دهید، ۲۵ درصد تخفیف شامل سبد‌خرید شما خواهد شد.
تعداد کتاب درصد تخفیف قیمت کتاب
1 بدون تخفیف 25,000 تومان
2 20 درصد 20,000 تومان
3 الی 5 25 درصد 18,750 تومان
6 الی 10 30 درصد 17,500 تومان
11 الی 20 35 درصد 16,250 تومان
21 الی 30 40 درصد 15,000 تومان
31 الی 40 45 درصد 13,750 تومان
41 الی 50 50 درصد 12,500 تومان
51 الی 70 55 درصد 11,250 تومان
71 الی 100 60 درصد 10,000 تومان
101 الی 150 65 درصد 8,750 تومان
151 الی 200 70 درصد 7,500 تومان
201 الی 300 75 درصد 6,250 تومان
301 الی 500 80 درصد 5,000 تومان
501 الی 1000 85 درصد 3,750 تومان
1001 الی 10000 90 درصد 2,500 تومان
توضیحات
Reinforcement learning is a learning paradigm concerned with learning to control a system so as to maximize a numerical performance measure that expresses a long-term objective.What distinguishes reinforcement learning from supervised learning is that only partial feedback is given to the learner about the learner’s predictions. Further, the predictions may have long term effects through influencing the future state of the controlled system. Thus, time plays a special role. The goal in reinforcement learning is to develop efficient learning algorithms, as well as to understand the algorithms’ merits and limitations. Reinforcement learning is of great interest because of the large number of practical applications that it can be used to address, ranging from problems in artificial intelligence to operations research or control engineering. In this book, we focus on those algorithms of reinforcement learning that build on the powerful theory of dynamic programming.We give a fairly comprehensive catalog of learning problems, describe the core ideas, note a large number of state of the art algorithms, followed by the discussion of their theoretical properties and limitations.

ترجمه فارسی (ترجمه ماشینی)

یادگیری تقویتی یک الگوی یادگیری است که مربوط به یادگیری کنترل یک سیستم به منظور به حداکثر رساندن یک معیار عملکرد عددی است که یک هدف بلند مدت را بیان می کند. چیزی که یادگیری تقویتی را از یادگیری نظارت شده متمایز می کند این است که فقط بازخورد جزئی در مورد پیش بینی های یادگیرنده به یادگیرنده داده می شود. . علاوه بر این، پیش‌بینی‌ها ممکن است از طریق تأثیرگذاری بر وضعیت آینده سیستم کنترل‌شده، اثرات بلندمدتی داشته باشند. بنابراین زمان نقش ویژه ای ایفا می کند. هدف در یادگیری تقویتی توسعه الگوریتم های یادگیری کارآمد و همچنین درک محاسن و محدودیت های الگوریتم ها است. یادگیری تقویتی به دلیل تعداد زیاد کاربردهای عملی که می توان از آن برای رسیدگی به آنها استفاده کرد، از مشکلات در هوش مصنوعی گرفته تا تحقیقات عملیات یا مهندسی کنترل، بسیار مورد توجه است. در این کتاب، ما بر روی آن دسته از الگوریتم‌های یادگیری تقویتی تمرکز می‌کنیم که مبتنی بر تئوری قدرتمند برنامه‌نویسی پویا هستند. ما فهرست نسبتاً جامعی از مشکلات یادگیری ارائه می‌دهیم، ایده‌های اصلی را توصیف می‌کنیم، تعداد زیادی از الگوریتم‌های پیشرفته را یادداشت می‌کنیم و به دنبال آن بحث در مورد خواص و محدودیت های نظری آنها.

نظرات (0)

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

اولین کسی باشید که دیدگاهی می نویسد “دانلود کتاب Algorithms for Reinforcement Learning”