Глибоке навчання з підкріпленням. AlphaGo та інші технології
Ця книга ─ докладне керівництво за новітніми інструментами DL і їхніми обмеженнями. Ви оціните на практиці такі методи, як крос-ентропія та градієнти за стратегіями, а потім навчитеся застосовувати їх. Подурюєтеся і з колекцією віртуальних ігор від Atari, і із сучасними фаворитами, наприклад Connect4. Максим Лапан підготували прекрасне введення в тему RL, щоб ви навчилися програмувати інтелектуальні самонавчання агенти, здатні виконувати колосальну кількість прикладних завдань.
Почніть впроваджувати Q-навчання в середовищах класу grid world, обвчіть вашого агента купувати на біржі, дізнайтеся, як моделі оброблення природної мови привели до вибухового поширення чат-ботів.
У цій книзі
• Ви дізнаєтеся, яке місце в контексті DL займають методи RL, реалізуєте складні моделі глибокого навчання
• Опануйте базовий рівень RL: марковські процеси прийняття рішень
• Оцініть різні методи RL, зокрема крос-ентропію, DQN, модель актора-критика, TRPO, PPO, DDPG, D4PG та ін.
• Дізнаєтеся, як працювати з дискретними та безперервними просторами дій у різних середовищах
• Навчіться перемагати в аркадних іграх Atari, використовуючи навчання з підкріпленням
• Створіть власне середовище за моделлю OpenAI Gym для навчання біржевого агента
• Навчіть вашого агента грати в Connect4, скориставшись методом AlphaGo Zero
• Познайомтеся з новітніми дослідженнями в галузі глибокого навчання, що стосуються розробки чат-ботів
Почніть впроваджувати Q-навчання в середовищах класу grid world, обвчіть вашого агента купувати на біржі, дізнайтеся, як моделі оброблення природної мови привели до вибухового поширення чат-ботів.
У цій книзі
• Ви дізнаєтеся, яке місце в контексті DL займають методи RL, реалізуєте складні моделі глибокого навчання
• Опануйте базовий рівень RL: марковські процеси прийняття рішень
• Оцініть різні методи RL, зокрема крос-ентропію, DQN, модель актора-критика, TRPO, PPO, DDPG, D4PG та ін.
• Дізнаєтеся, як працювати з дискретними та безперервними просторами дій у різних середовищах
• Навчіться перемагати в аркадних іграх Atari, використовуючи навчання з підкріпленням
• Створіть власне середовище за моделлю OpenAI Gym для навчання біржевого агента
• Навчіть вашого агента грати в Connect4, скориставшись методом AlphaGo Zero
• Познайомтеся з новітніми дослідженнями в галузі глибокого навчання, що стосуються розробки чат-ботів
Інформація про книгу | |
Кількість сторінок | 496 |
Мова видання | російска |
Рік видання | 2020 |
ISBN | 978-5-4461-1079-7 |
Вид палітурки | М'який |
Стан | Нове |
Тематика | Комп'ютерна література для професіоналів |