Обучение с подкреплением: от определений до AlphaZero и Dactyl, осень 2020

Обучение с подкреплением: от определений до AlphaZero и Dactyl
Санкт-Петербург / осень 2020, посмотреть все семестры

Запишитесь на курс, чтобы получать уведомления и иметь возможность сдавать домашние задания. Для записи требуется регистрация на сайте.
Перейти к регистрации Войти

Машинное обучение обычно делится на обучение с учителем и без оного. Обучение с подкреплением -- это третий путь, в котором обучающийся агент взаимодействует с окружением, получая от него награды или наказания за свои действия. Обучение с подкреплением в последние годы производит много громких новостей: только в играх мы уже слышали об AlphaGo, AlphaZero, MuZero, AlphaStar, OpenAI Five и многом другом, а это только одно применение... В мини-курсе мы поговорим об основных постановках задач в обучении с подкреплением, разберёмся, как в обучение с подкреплением вошли глубокие нейронные сети, и постараемся дойти до самых последних результатов.

Лекции будут читаться через zoom. Ссылка для подключения будет опубликована в новостях курса (её получат те, кто запишется на курс).

Дата и время	Занятие	Место	Материалы
05 декабря 16:00–17:20	Лекция 1, Лекция	Конференция в zoom, Онлайн	видео
05 декабря 16:40–19:00	Лекция 2, Лекция	Конференция в zoom, Онлайн	видео

Сергей Игоревич Николенко

Обучение с подкреплением: от определений до AlphaZero и Dactyl Санкт-Петербург / осень 2020, посмотреть все семестры

Обучение с подкреплением: от определений до AlphaZero и Dactyl
Санкт-Петербург / осень 2020, посмотреть все семестры