Машинное обучение обычно делится на обучение с учителем и без оного.
Обучение с подкреплением -- это третий путь
, в котором обучающийся
агент взаимодействует с окружением, получая от него награды или
наказания за свои действия. Обучение с подкреплением в последние годы
производит много громких новостей: только в играх мы уже слышали об
AlphaGo, AlphaZero, MuZero, AlphaStar, OpenAI Five и многом другом, а
это только одно применение... В мини-курсе мы поговорим об основных
постановках задач в обучении с подкреплением, разберёмся, как в
обучение с подкреплением вошли глубокие нейронные сети, и постараемся
дойти до самых последних результатов.
Semester | Branch |
---|---|
autumn 2020 | Saint Petersburg |