тем лучше - прямой путь в неприятный новый мир боли
почему?
Ну ты как себе представляешь свою работу в такой день? Пойти переобучать модель с учётом нового - горизонтом в 1 день лол - баланса классов?)
я представляю, что модель отработает с предсказуемым качеством, без сюрпризов. Поток сознания про переобучать с горизонтом не распарсил.
Я недавно натренил модель распознавания движений и вне зависимости от параметров она давала точность 95+ процентов. Пока не додумался сделать тест достаточно отличающийся от трейна. Мой вывод (не знаю, какой ваш) - трейн должен быть максимально похож на тест, но тест должен должен быть достаточно разнородный, вплоть до того, чтобы быть похожим на (все!) данные в проде P.s. естественно, пример притянут за уши, других в последнее время не было
в этом примере трейн негодный просто.
Имелось в виду, как выглядит работа дата сайнсера в день, когда баланс классов стал отличаться от прода в предположении "чем более данные за какой-то день похожи на обучающую выборку, тем лучше"
можно получить ответ без встречных риторических вопросов и зафлуживания?
Исходя из твоих предыдущих сообщений ("нужно отлавливать смещение баланса классов на мониторинге", "нужно, чтобы трейн был репрезентативен продовому тесту"), я сделал предположение о том, что ты пойдёшь переобучать модель, подстроив баланс классов под новый, что делает тебя оператором моделей машинного обучения, а не дата сайнтистом Если же ты не побежишь перестраивать модель, то зачем вообще была телега про связь балансов на трейне и продовом тесте? Ну окей, будешь грустить сидеть значит, что так получилось В любом случае выходит боль
Я писал про ситуацию, когда ничего не поменялось и прод 100% соответствует тесту и трейну. И хочу узнать, в чем ужас именно этой ситуации
Ни в чём, очевидно
Обсуждают сегодня