Глибоке навчання з підкріпленням. AlphaGo та інші технології

Артикул: LB-0001062
Наявність:Є в наявності

660.00 грн.

Кількість

Ця книга ─ докладне керівництво за новітніми інструментами DL і їхніми обмеженнями. Ви оціните на практиці такі методи, як крос-ентропія та градієнти за стратегіями, а потім навчитеся застосовувати їх. Подурюєтеся і з колекцією віртуальних ігор від Atari, і із сучасними фаворитами, наприклад Connect4. Максим Лапан підготували прекрасне введення в тему RL, щоб ви навчилися програмувати інтелектуальні самонавчання агенти, здатні виконувати колосальну кількість прикладних завдань.
Почніть впроваджувати Q-навчання в середовищах класу grid world, обвчіть вашого агента купувати на біржі, дізнайтеся, як моделі оброблення природної мови привели до вибухового поширення чат-ботів.

У цій книзі
• Ви дізнаєтеся, яке місце в контексті DL займають методи RL, реалізуєте складні моделі глибокого навчання
• Опануйте базовий рівень RL: марковські процеси прийняття рішень
• Оцініть різні методи RL, зокрема крос-ентропію, DQN, модель актора-критика, TRPO, PPO, DDPG, D4PG та ін.
• Дізнаєтеся, як працювати з дискретними та безперервними просторами дій у різних середовищах
• Навчіться перемагати в аркадних іграх Atari, використовуючи навчання з підкріпленням
• Створіть власне середовище за моделлю OpenAI Gym для навчання біржевого агента
• Навчіть вашого агента грати в Connect4, скориставшись методом AlphaGo Zero
• Познайомтеся з новітніми дослідженнями в галузі глибокого навчання, що стосуються розробки чат-ботів

Інформація про книгу
Кількість сторінок	496
Мова видання	російска
Рік видання	2020
ISBN	978-5-4461-1079-7
Вид палітурки	М'який
Стан	Нове
Тематика	Комп'ютерна література для професіоналів