В продолжение вопросов о бинарном классификаторе, вопрос выше все еще

Question

В продолжение вопросов о бинарном классификаторе, вопрос выше все еще

актуален, по мимо него вопрос в следующем:
допустим у меня есть датасет на 100к записей, лэйблы распределены примерно 80% и 20%, стоит ли обучать так или лучше взять 40к 50% одинх и 50% других?

0

29.01.2019

3 ответов

51 просмотр

Evgenii Zheltonozhskii🇮🇱

просто семплируй пропорционально

0

29.01.2019

Arcady

И чем кончилась дискуссия? Я лично msfe имплементировал вместо MSE но только из-за неимения альтернатив

0

07.02.2019

Vladislav Gusak · Accepted Answer

Vladislav Gusak

Когда у меня была такая проблема, я просто повысил loss weight тому классу, записей которого было меньше, если было бы распределение , как у тебя, то увеличил бы в 4 раза, чтоб было "равным"

0

29.01.2019

Похожие чаты

В продолжение вопросов о бинарном классификаторе, вопрос выше все еще

3 ответов

Похожие вопросы