Всем привет! Не подскажете по поводу переобучения? Строю классификатор на рэндом форесте. Подбираю глубину деревьев. Если ограничить глубину маленьким значением, то точность н...
Ага, про кроссвалидацию думал, но пока не стал делать. KFold ведь тоже сработает нормально? Просто наблюдений не оч много, не хочу на 3 части данные делить. А в вашем примере ...
Интересует прогноз по каждому клиенту по каждому дню? Это вообще реально? Если речь о покупках всех клиентов по каждому дню - это уже более реальная задача. Но конечно тоже в...
Ну т.е. по сути речь о том, что нам не важно как на трейне переобучится модель, лишь бы на валидации и на тесте работала лучше, чем с другими параметрами?
Ты имеешь в виду стоп слова убрать? Да. Или что-то еще? А синонимичные ряды как можно составлять не подскажешь? Я так понимаю не вручную же
Не пробовал, вы имеете в виду на кучу фолдов в кросс валидации разбить? Данные - текст. Переменнные мешок слов и мешок н-грамм
Вот не хочу показаться снобом, занудой или еще каким-нибудь говнарем, но скажите, зачем писать один месседж в восьми сообщениях??
Кстати кто-нибудь завтра на Дата фест идет?
Кому жаловаться на админа?
А корпус заявок размеченный?
Можно ссылку, плиз?