Глибоке навчання з підкріпленням. AlphaGo та інші технології

Глибоке навчання з підкріпленням. AlphaGo та інші технології


  • Артикул: LB-0001062
  • Наявність:Є в наявності

  • 700.00 грн.

Ця книга ─ докладне керівництво за новітніми інструментами DL і їхніми обмеженнями. Ви оціните на практиці такі методи, як крос-ентропія та градієнти за стратегіями, а потім навчитеся застосовувати їх. Подурюєтеся і з колекцією віртуальних ігор від Atari, і із сучасними фаворитами, наприклад Connect4. Максим Лапан підготували прекрасне введення в тему RL, щоб ви навчилися програмувати інтелектуальні самонавчання агенти, здатні виконувати колосальну кількість прикладних завдань.
Почніть впроваджувати Q-навчання в середовищах класу grid world, обвчіть вашого агента купувати на біржі, дізнайтеся, як моделі оброблення природної мови привели до вибухового поширення чат-ботів.

У цій книзі
• Ви дізнаєтеся, яке місце в контексті DL займають методи RL, реалізуєте складні моделі глибокого навчання
• Опануйте базовий рівень RL: марковські процеси прийняття рішень
• Оцініть різні методи RL, зокрема крос-ентропію, DQN, модель актора-критика, TRPO, PPO, DDPG, D4PG та ін.
• Дізнаєтеся, як працювати з дискретними та безперервними просторами дій у різних середовищах
• Навчіться перемагати в аркадних іграх Atari, використовуючи навчання з підкріпленням
• Створіть власне середовище за моделлю OpenAI Gym для навчання біржевого агента
• Навчіть вашого агента грати в Connect4, скориставшись методом AlphaGo Zero
• Познайомтеся з новітніми дослідженнями в галузі глибокого навчання, що стосуються розробки чат-ботів
Інформація про книгу
Кількість сторінок 496
Мова видання російска
Рік видання 2020
ISBN 978-5-4461-1079-7
Вид палітурки М'який
Стан Нове
Тематика Комп'ютерна література для професіоналів

Написати відгук

Примітка: HTML розмітка не підтримується! Використовуйте звичайний текст.
    Погано           Добре
Захист від роботів