215 похожих чатов

Хорошо, с моделями понятно, а данные мне этот способ не

поможет оценить? Скажем, вырожденный пример - добавляю колонку шума. Я ожидаю, что без неё модель будет лучше себя чувствовать, однако какая-то модель вдруг начинает работать лучше (положим, что данных у нас достаточно много) - как на такое реагировать? И обратный пример - я вот не знаю, какая колонка - случайный шум (но какая-то точно), я могу с помощью моделей понять где он?

7 ответов

29 просмотров

Самое простое - кросс-валидация с и без. Можно ещё посмотреть для интереса, какое качество чисто на данной колонке, если ооочень низкое, то тут подозрение. Но тут осторожней, потому что иногда по одному признаки не работают, а в паре, тройке вместе дают результат.

Надо смотреть на импотанс этой переменной - если она каким-то образом важна, то да, что-то не то. Но пример, почему в такой ситуации может улучшиться качество - у бустингов есть параметр фиче фрекшн. Добавив колонку, рандомайзер при фиксированном сиде для построения дерева / текущего сплита выберет другую подбвыборку признаков. И так для каждого дерева. Итого финальный ансамбль будет чуть другим. И у него качество может отличаться. Как в плюс, так и в минус. Подобного эффекта можно добиться тупо поменяв сид или перемешав порядок признаков.

Дмитрий Симаков
Надо смотреть на импотанс этой переменной - если о...

С нейронками ещё сложнее. Там модель может совершенно по разному сходиться при разном размере фходного слоя. Поэтому добавив одну фичу можно что-то поломать. Даже если сама фича бесполезная. Или наоборот полезная. И надо перетюнивать архитектуру / оптимайзер / шедулер.

Дмитрий Симаков
С нейронками ещё сложнее. Там модель может соверш...

а на кагле еще любит ошибка сабмита вылазить когда на приват подменяется тестовый сет по той же причине

Kirill Burovin
а на кагле еще любит ошибка сабмита вылазить когда...

Не так давно была забавная история, что ребята специально выбрасывали эксепшн, если скор недотягивал на тестовой части

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта