sampling, но в применении для классификации предложений?
У меня очень несбалансированный датасет, где 80% данных - это один класс, и остальные 20% - это ещё 5 классов. И модель плохо обучается (пробовала сбалансировать датасет и на каждой эпохе подкидывать рандомно выбранные из большого класса экземпляры, каждый раз другие, но не особо помогает).
Или может кто-то сталкивался с такой проблемой?
А хард негативы семплил?
Обсуждают сегодня