Недообучение и переобучение в машинном интеллекте // Константин Воронцов / ПостНаука
В машинном обучении существуют две важные проблемы: недообучение и переобучение. Алгоритмы машинного интеллекта обучаются по прецедентам, когда есть некая модель — параметрическое семейство функций. Предполагается, что в семействе функций есть одна или несколько функций, которые описывают зависимость, наблюдаемую в данных. Роль данных или обучающей выборки здесь играют точки. Точки — пары X и Y, где X — объект, Y — ответ. Следовательно, ответ — показатель, который соответствует данному объекту. Изначально нужно научиться предсказывать эти ответы на объектах. Для этого ученые занимаются моделированием и выбирают из параметрического семейства функций модель, которая лучше. Математик Константин Воронцов о машинных алгоритмах, исследовании данных и нейронных сетях Константин Воронцов — доктор физико-математических наук, профессор РАН, руководитель лаборатории Машинного интеллекта МФТИ, заведующий отделом Интеллектуальных систем ФИЦ ИУ РАН.