Навчання з підкріпленням для реальних завдань. Філ Віндер
Книга присвячена промислово-орієнтованому застосуванню навчання з підкріпленням (Reinforcement Learning, RL). Пояснено, як навчати промислові та наукові системи розв'язання будь-яких покрокових завдань методом проб і помилок - без підготовки вузькоспеціалізованих навчальних множин даних і без ризику перенавчити або переускладнити алгоритм. Розглянуто марковські процеси ухвалення рішень, глибокі Q-мережі, градієнти політик і їхнє обчислення, методи усунення ентропії та багато іншого. Ця книга - перша російською мовою, де теоретичний базис RL і алгоритми подано в прикладному, галузевому ключі.
Інформація про книгу | |
Автор | Філ Віндер |
Обкладинка | М'яка |
Кількість сторінок | 400 |
Мова видання | Російська |
Ілюстрації | Чорно-білі |
Рік видання | 2023 |