ИИ-2022, Лекция 13, часть 4/6

22.05.2022
#ии #reinforcementlearning #actorcritic Курс "Общий Искусственный Интеллект", читается на Факультете свободных искусств и наук Санкт-Петербургского Государственного Университета, весенний семестр 2022 года. Лекция 13, Глубокое обучение с подкреплением, часть 1 из 6 Слайды к лекции: https://docs.google.com/presentation/d/1N5dC2fLJk6eMTOsjy1MO7_kytVdmU-QlwQ049pZwSZM/edit?usp=sharing 00:00 Actor-Critic 05:53 Advantage 11:48 Actor-Critic для V-функции 12:30 Bootstrap vs Монте-Карло для ценности состояния 16:20 Проблемы bootstrapped estimate для ценности состояния

Похожие видео

Показать еще