Computer Science Club

Машинное обучение обычно делится на обучение с учителем и без оного. Обучение с подкреплением -- это третий путь, в котором обучающийся агент взаимодействует с окружением, получая от него награды или наказания за свои действия. Обучение с подкреплением в последние годы производит много громких новостей: только в играх мы уже слышали об AlphaGo, AlphaZero, MuZero, AlphaStar, OpenAI Five и многом другом, а это только одно применение... В мини-курсе мы поговорим об основных постановках задач в обучении с подкреплением, разберёмся, как в обучение с подкреплением вошли глубокие нейронные сети, и постараемся дойти до самых последних результатов.

Course Offerings

Semester	Branch
autumn 2020	Saint Petersburg

Reinforcement Learning: from Definitions to AlphaZero and Dactyl

Course Offerings