Slivinfo
Бот
Обучение с подкреплением для реальных задач [Фил Уиндер]
Loriem
Cсылка доступна только для пользователей!
Книга посвящена промышленно-ориентированному применению обучения с подкреплением (Reinforcement Learning, RL). Объяснено, как обучать промышленные и научные системы решению любых пошаговых задач методом проб и ошибок – без подготовки узкоспециализированных учебных множеств данных и без риска переобучить или переусложнить алгоритм. Рассмотрены марковские процессы принятия решений, глубокие Q-сети, градиенты политик и их вычисление, методы устранения энтропии и...
Cсылка доступна только для пользователей!
Этот курс появится в скором времени на форуме SLIV-INFO.COM. Проверьте по поиску форума, возможно данный курс уже слит.