Как работать с несбалансированными данными в машинном обучении?
Бесплатный вопрос
Консультация закрыта | Ответов: 0
Добрый день. Я пытаюсь создать модель для классификации клиентов по степени их лояльности. Проблема в том, что мой набор данных очень несбалансирован: из 10 000 записей, только 500 относятся к классу "лояльные клиенты". Моя модель постоянно предсказывает, что клиент нелояльный, и игнорирует малую группу лояльных клиентов. Как справиться с этой проблемой? Слышал про методы апсемплинга и смещение порогов, но не знаю, как их правильно применить.
Статьи по информационным технологиям
Поделитесь этой страницей в соцсетях: