215 похожих чатов

Нужен совет. Обучаю модель на 500к данных. Классов поровну. Даже

если на 40 процентах обучить, на оставшихся 60 аккураси будет 97 процентов. Проверяю в проде - вообще чушь предиктит. Пишу ещё данных, снова обучаю по ним, ситуация повторяется. Выглядит, будто в жизни есть ещё данные, по которым модель не обучалась, но как понять, что стоит ещё записать?

10 ответов

24 просмотра

Train test есть?) Отмена, перечитал вопрос

может утечка данных? leaky predictors? утечка при нормализации?

Aleksei
может утечка данных? leaky predictors? утечка при ...

https://www.atoti.io/what-is-data-leakage-and-how-to-mitigate-it/

Misha- Автор вопроса
Aleksei
может утечка данных? leaky predictors? утечка при ...

Спасибо, почитал. "The model might be somehow memorizing the feature-target relations instead of learning and generalizing." очень похоже на мой случай. Но даже не знаю, что может быть. Датасет я делил по-разному, данные не нормализовал, потому что одной размерности и xgboost к этому не чувствителен. Пропущенные значения просто удаляются и их меньше сотой процента..

A обучающая выборка на продовые данные похожа?

Misha- Автор вопроса
Ian Pilé
A обучающая выборка на продовые данные похожа?

по идее должна быть. я лично записываю показания от другой нейронки с фронталки айфона. датчик глубины, углы головы\глаз. и либо я что-то упускаю в записи, либо у меня где-то утечка, которую я не могу найти

Посмотри ещё features importance, если ли там аномально значимые фичи

Олег Юшин
Посмотри ещё features importance, если ли там аном...

А о чем говорит аномальная значимость фичи?

Nick
А о чем говорит аномальная значимость фичи?

Через такую фичю может утечка данных идти

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта