Обучение с подкреплением для реальных задач. Фил Уиндер
Книга посвящена промышленно-ориентированному применению обучения с подкреплением (Reinforcement Learning, RL). Объяснено, как обучать промышленные и научные системы решению любых пошаговых задач методом проб и ошибок— без подготовки узкоспециализированных учебных множеств данных и без риска переобучить или переусложнить алгоритм. Рассмотрены марковские процессы принятия решений, глубокие Q-сети, градиенты политик и их вычисление, методы устранения энтропии и многое другое. Данная книга — первая на русском языке, где теоретический базис RL и алгоритмы даны в прикладном, отраслевом ключе.
Информация о книге | |
Автор | Фил Уиндер |
Обложка | Мягкая |
Количество страниц | 400 |
Язык издания | Русский |
Иллюстрации | Чёрно-белые |
Год издания | 2023 |