и тренить на нем, а потом тестить на чистом тесте. или юзать imblearn.Pipleine и на кросс валидацию?
Если 1 класса достаточно, чтобы уловить распределение(не 10 объектов, а намного больше), то можно браться. В таком случае, для бинарки и лог лосса не делать ничего, просто подобрать порог потом пониже для 1 класса. Для остальных случаев воспользоваться весами при обучении, к примеру в катбусте опция class "balanced" или там ещё можно словарь с весами подать.
Обсуждают сегодня