215 похожих чатов

Добрый день, подскажите, какие подходы могут быть для колонок, которые

преимущественно не имеют значений в задаче классификации? Под преимущественно не имеют значений имею ввиду что 80-90% значений пустые, но которые заполнены несут потенциально полезную инфу. Заполнять всякими средними и медианами может быть неэффективно, каких-то готовых решений по этой задаче не видел

7 ответов

12 просмотров

замените все наны одним определенным значением. В рамках одного признака, разумеется

Превратить колонку в 2, одну из них сделать true|false, пустые значения во второй забить чем-то типа нулей

Денис-Лазаренко Автор вопроса
Антон Дорохов
замените все наны одним определенным значением. В ...

вот тут момент возникает связанный с интерпретацией этих фичей после обучения. Если мы все пропущенные признаки забили условными 0, то как адекватно интерпретировать вес при этом признаке?

ну тут много вариантов что может пойти не так) например если тип данных инт и вы заполните 80% нанов каким либо интом то их вес может привести к некорректным результатам. Сначала бы стату посмотреть по реальным данным

Денис-Лазаренко Автор вопроса
Антон Дорохов
ну тут много вариантов что может пойти не так) нап...

Да, я поэтому и спрашиваю, потому что с этими признаками сложно работать нормально. Проблема в том, что никаких других данных по этим признакам нет, неясно как стату в таком случае считать

Денис Лазаренко
Да, я поэтому и спрашиваю, потому что с этими приз...

Если никаких других данных нет - это просто пустая строка без признаков?

Похожие вопросы

Обсуждают сегодня

Мужики и девушки, привет) в Вelphi xe7 в настройках во вкладке "Editor Options" далее " Color" есть список: "Elements", открыв который мы можем настраивать отображение разных...
Kraszx
14
Добрый вечер. Есть вопрос, а может и предложение. Был у меня диалог в другой группе о делфи и я задался вопросом: "А нельзя ли в делфи цвет //коментария и {комментария} сде...
Kraszx
24
как быть с принтером? такой подход прокатит?
zamtmn
12
Всем привет! Подскажи, пожалуйста, как передать в TComboBox сразу значение и id записи. На Delphi я делал так: ComboBox1.Items.AddObject('Какое-то значение', Pointer(id запис...
Евгений
13
Мдя, прикол, боевая сборка запускается (именно под отладчиком) после F9 примерно полторы минуты (97 секунд если быть точным). Начал копать - проблема детектится сразу - зависа...
Александр (Rouse_) Багель
38
А вот это что за конструкция? Вернее, она тут нафига?
Serjone
10
Привет. Подскажите, как правильно сматчить лист фиксированного размера, чтобы компилятор не говорил мне о неполном паттерне? Допустим что-то такое [x', y'] = sort [x, y]?
Arseny
8
Здравствуйте, вопрос по структурам данных. Были у вас случаи, когда пришлось писать деревья или двунаправленные списки?
/ /
50
Товарищи, кто работа с iphelper? Или может я в самой логике ошибки фигачу, не пойму.... var ifTable : PMIB_IFTABLE; size, corSize: DWORD; Buffer ...
Warfarellen
4
Мужики. привет) в Вelphi xe7 в настройках во вкладке "Editor Options" далее " Color" есть список: "Elements", открыв который мы можем настраивать отображение разных элементов...
Kraszx
2
Карта сайта