Обучение с подкреплением
Проект в рамках Центра ИИ НИУ ВШЭ «Разработка и верификация алгоритмов и дополнительных математических моделей улучшения эффективности исследования среды в обучении с подкреплением» под руководством Алексея Наумова. Сергей Самсонов и Даниил Тяпкин рассказывают о статье Tiapkin D., Belomestny D., Moulines É., Naumov A., Samsonov S., Tang Y., Valko M., Ménard P. From Dirichlet to Rubin: Optimistic Exploration in RL without Bonuses, ICML-2022, long presentation.
Похожие видео
Показать еще