215 похожих чатов

Добрый день, подскажите, какие подходы могут быть для колонок, которые

преимущественно не имеют значений в задаче классификации? Под преимущественно не имеют значений имею ввиду что 80-90% значений пустые, но которые заполнены несут потенциально полезную инфу. Заполнять всякими средними и медианами может быть неэффективно, каких-то готовых решений по этой задаче не видел

7 ответов

13 просмотров

замените все наны одним определенным значением. В рамках одного признака, разумеется

Превратить колонку в 2, одну из них сделать true|false, пустые значения во второй забить чем-то типа нулей

Денис-Лазаренко Автор вопроса
Антон Дорохов
замените все наны одним определенным значением. В ...

вот тут момент возникает связанный с интерпретацией этих фичей после обучения. Если мы все пропущенные признаки забили условными 0, то как адекватно интерпретировать вес при этом признаке?

ну тут много вариантов что может пойти не так) например если тип данных инт и вы заполните 80% нанов каким либо интом то их вес может привести к некорректным результатам. Сначала бы стату посмотреть по реальным данным

Денис-Лазаренко Автор вопроса
Антон Дорохов
ну тут много вариантов что может пойти не так) нап...

Да, я поэтому и спрашиваю, потому что с этими признаками сложно работать нормально. Проблема в том, что никаких других данных по этим признакам нет, неясно как стату в таком случае считать

Денис Лазаренко
Да, я поэтому и спрашиваю, потому что с этими приз...

Если никаких других данных нет - это просто пустая строка без признаков?

Похожие вопросы

Обсуждают сегодня

30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Как передать управляющий символ в открытую через CreateProcess консоль? Собсна, есть процедура: procedure TRedirectThread.WriteData(Data: OEMString); var Written: Cardinal;...
Serjone
6
Всем привет! Имеется функция: function IsValidChar(ch: UTF8Char): Boolean; var i: Integer; ValidChars: AnsiString; begin ValidChars := 'abcdefghijklmnopqrstuvwxyzABCDE...
Евгений
44
Карта сайта