Алгоритми навчання з підкріпленням на Python. Лонца Андреа
Алгоритми навчання з підкріпленням на Python. Лонца Андреа
- Виробник: ДМК Пресс
- Артикул: LB-0001379
- Наявність:Є в наявності
- 780.00 грн.
Ця книга допоможе читачеві оволодіти алгоритмами навчання з підкріпленням (ВП) і навчитися реалізовувати їх при створенні самонавчаючих агентів.
В первой части рассматриваются различные элементы ОП, сфера его применения, инструменты, необходимые для работы в среде ОП. Вторая и третья части посвящены непосредственно алгоритмам. В числе прочего автор показывает, как сочетать Q-обучение с нейронными сетями для решения сложных задач, описывает методы градиента стратегии, TRPO и PPO, позволяющие повысить производительность и устойчивость, а также детерминированные алгоритмы DDPG и TD3. Читач дізнається про те, як працює техніка подражательного навчання, познайомиться з алгоритмами дослідження на базі верхньої довірчої межі (UCB і UCB1) і мета-алгоритмом ESBAS.
Видання призначене для тих, хто цікавиться дослідженнями в області штучного інтелекту, застосовує в роботі глибоке навчання або хоче освоїти навчання з підкріпленням з нуля. Обов'язкова умова – володіння мовою Python на робочому рівні.
В первой части рассматриваются различные элементы ОП, сфера его применения, инструменты, необходимые для работы в среде ОП. Вторая и третья части посвящены непосредственно алгоритмам. В числе прочего автор показывает, как сочетать Q-обучение с нейронными сетями для решения сложных задач, описывает методы градиента стратегии, TRPO и PPO, позволяющие повысить производительность и устойчивость, а также детерминированные алгоритмы DDPG и TD3. Читач дізнається про те, як працює техніка подражательного навчання, познайомиться з алгоритмами дослідження на базі верхньої довірчої межі (UCB і UCB1) і мета-алгоритмом ESBAS.
Видання призначене для тих, хто цікавиться дослідженнями в області штучного інтелекту, застосовує в роботі глибоке навчання або хоче освоїти навчання з підкріпленням з нуля. Обов'язкова умова – володіння мовою Python на робочому рівні.
Інформація про книгу | |
Автор | Лонца Андреа |
Кількість сторінок | 286 |
Мова видання | російска |
Рік видання | 2020 |
ISBN | 978-5-97060-855-5 |
Вид палітурки | Твердий |
Оригінальна назва | "Reinforcement Learning Algorithms with Python" |