Машинное обучение обычно делится на обучение с учителем и без оного.
Обучение с подкреплением -- это третий путь
, в котором обучающийся
агент взаимодействует с окружением, получая от него награды или
наказания за свои действия. Обучение с подкреплением в последние годы
производит много громких новостей: только в играх мы уже слышали об
AlphaGo, AlphaZero, MuZero, AlphaStar, OpenAI Five и многом другом, а
это только одно применение... В мини-курсе мы поговорим об основных
постановках задач в обучении с подкреплением, разберёмся, как в
обучение с подкреплением вошли глубокие нейронные сети, и постараемся
дойти до самых последних результатов.
Лекции будут читаться через zoom. Ссылка для подключения будет опубликована в новостях курса (её получат те, кто запишется на курс).
Date and time | Class|Name | Venue|short | Materials |
---|---|---|---|
05 December 16:00–17:20 |
Лекция 1, Lecture | Конференция в zoom, Онлайн | video |
05 December 16:40–19:00 |
Лекция 2, Lecture | Конференция в zoom, Онлайн | video |