215 похожих чатов

Чем более данные за какой-то день похожи на обучающую выборку,

тем лучше - прямой путь в неприятный новый мир боли
почему?

11 ответов

13 просмотров

Ну ты как себе представляешь свою работу в такой день? Пойти переобучать модель с учётом нового - горизонтом в 1 день лол - баланса классов?)

Andrey- Автор вопроса

я представляю, что модель отработает с предсказуемым качеством, без сюрпризов. Поток сознания про переобучать с горизонтом не распарсил.

Я недавно натренил модель распознавания движений и вне зависимости от параметров она давала точность 95+ процентов. Пока не додумался сделать тест достаточно отличающийся от трейна. Мой вывод (не знаю, какой ваш) - трейн должен быть максимально похож на тест, но тест должен должен быть достаточно разнородный, вплоть до того, чтобы быть похожим на (все!) данные в проде P.s. естественно, пример притянут за уши, других в последнее время не было

Andrey- Автор вопроса
Andrey
я представляю, что модель отработает с предсказуем...

Имелось в виду, как выглядит работа дата сайнсера в день, когда баланс классов стал отличаться от прода в предположении "чем более данные за какой-то день похожи на обучающую выборку, тем лучше"

Andrey- Автор вопроса

можно получить ответ без встречных риторических вопросов и зафлуживания?

Andrey
можно получить ответ без встречных риторических во...

Исходя из твоих предыдущих сообщений ("нужно отлавливать смещение баланса классов на мониторинге", "нужно, чтобы трейн был репрезентативен продовому тесту"), я сделал предположение о том, что ты пойдёшь переобучать модель, подстроив баланс классов под новый, что делает тебя оператором моделей машинного обучения, а не дата сайнтистом Если же ты не побежишь перестраивать модель, то зачем вообще была телега про связь балансов на трейне и продовом тесте? Ну окей, будешь грустить сидеть значит, что так получилось В любом случае выходит боль

Andrey- Автор вопроса
Superhero Yakovlev
Исходя из твоих предыдущих сообщений ("нужно отлав...

Я писал про ситуацию, когда ничего не поменялось и прод 100% соответствует тесту и трейну. И хочу узнать, в чем ужас именно этой ситуации

Похожие вопросы

Обсуждают сегодня

А как старый хаскел с новым стыковать ? потому как тут работает https://play.haskell.org/saved/C3xpMzcd, а вот тут https://stepik.org/lesson/7602/step/9?unit=1473 нет ошибка C...
Fedor
131
Вопрос я правильно понимаю что в коде newtype ArrowMap k v = ArrowMap { getArrowMap :: k -> Maybe v } getArrowMap есть функция типа k -> Maybe v, если да, то не понимаю задач...
Fedor
61
Продолжая диалог про свифт в проде – сейчас возник вопрос в активном наборе бекендеров. В основном в нашей компании мы фанаты Java Spring и полностью ей довольны. Однако найм ...
Guseyn
27
Как Вы считаете нормально ли в двадцатых годах 21 века в ВУЗах Российской Федерации обучать студентов работе с TASM? Не слишком ли это "архаично"? (Если оффтоп или флейм для э...
Spiker01
52
Комрады, хотел уточнить. Проперть в OnDestroy юнита-хозяина по-прежнему доступна? И еще уточнение: finalization юнита наступает раньше или позже OnDestroy?
Ed Doc
48
Читаю сейчас [нет, уже больше не читаю!] курсовую о Булгакове, написанную, похоже, с помощью ChatGPT. Это удивительный психоделический опыт. Текст в основном написан в стиле б...
✨ Uni [🌊 В отпуске]
1
Всем привет! поделитесь, пож-та, как кто дебажил / решал проблему с 504 Time out ошибкой от nginx, когда стучишься на свой vapor сервер? в логах /var/log/nginx/error.log е...
Paul
24
Привет всем. Не знаю, удачный ли чатик я выбрал для вопроса, но он как будто в целом про концепцию фп и конкретно про Haskell. Прочитал, что в целом в мире фп нет идеи мутабел...
Gellert Cringewald
15
Как добавить ссылку в Быстрый доступ в Проводнике windows 10? Нашёл, как на power shell сделать, но может есть способ через Дельфи?
А
31
@helgispbru @Dreamer_0x01 @Pathologic93 @webber_12 Не уверен, что вам всем это жутко интересно, но в продолжение недавнего диалога отправлю свои наброски. Хочу понять, правил...
Андрей [aharito] Харитонов
13
Карта сайта