Обучение с подкреплением

04.08.2022
Проект в рамках Центра ИИ НИУ ВШЭ «Разработка и верификация алгоритмов и дополнительных математических моделей улучшения эффективности исследования среды в обучении с подкреплением» под руководством Алексея Наумова. Сергей Самсонов и Даниил Тяпкин рассказывают о статье Tiapkin D., Belomestny D., Moulines É., Naumov A., Samsonov S., Tang Y., Valko M., Ménard P. From Dirichlet to Rubin: Optimistic Exploration in RL without Bonuses, ICML-2022, long presentation.

Похожие видео

Показать еще