Как работать с несбалансированными данными в машинном обучении?




Бесплатный вопрос
Консультация закрыта | Ответов: 0

Добрый день. Я пытаюсь создать модель для классификации клиентов по степени их лояльности. Проблема в том, что мой набор данных очень несбалансирован: из 10 000 записей, только 500 относятся к классу "лояльные клиенты". Моя модель постоянно предсказывает, что клиент нелояльный, и игнорирует малую группу лояльных клиентов. Как справиться с этой проблемой? Слышал про методы апсемплинга и смещение порогов, но не знаю, как их правильно применить.


Поделитесь этой страницей в соцсетях: