актуален, по мимо него вопрос в следующем:
допустим у меня есть датасет на 100к записей, лэйблы распределены примерно 80% и 20%, стоит ли обучать так или лучше взять 40к 50% одинх и 50% других?
Когда у меня была такая проблема, я просто повысил loss weight тому классу, записей которого было меньше, если было бы распределение , как у тебя, то увеличил бы в 4 раза, чтоб было "равным"
просто семплируй пропорционально
И чем кончилась дискуссия? Я лично msfe имплементировал вместо MSE но только из-за неимения альтернатив
Обсуждают сегодня