215 похожих чатов

Https://Www.Kaggle.Com/C/Test-Of-Classification/ Есть соревнование по классификации. Предсказание пола пользователя Кинопоиска по его

оценкам фильмов.
Примечательно то, что NaN есть и в трейне и в тесте.
Мой план таков - Заполняю NaN в оценках фильмов в трейне средним значением с группировкой по полу пользователя.
Беру срез из теста, например 10 строк. Выкидываю столбцы с пропусками, обучаю классификатор на трейне ровно по тем оставшимся стобцам, которые остались в срезе из теста. Предсказываю пол для этого среза. Заполняю пропуски средним значением согласно поправке на предсказанный пол. Далее беру следующий срез, выкидываю столбцы с NaN и повторяю процедуру, пока не пройдусь по всему тесту. На каждой итерации буду добавлять заполненные данные из трейна в тест. Как вам такой план? Изначально тестовых строк в 2 раза больше чем в трейне.
___
Была ещё мысль использовать k-nearest neighbors для заполнения пропусков или классификации.

1 ответов

3 просмотра

Заполняю пропуски средним значением согласно поправке на предсказанный пол. - хотите якобы предсказывать пол для среза, но потом о предсказаниях забывать, пока не уберете пропуски по всему тесту, и тогда уже делать общий прогноз?

Похожие вопросы

Обсуждают сегодня

А чем вам питонисты не угодили?😂
.
79
Язык Си можно выучить за день? По книжке ANSI C на 230 страниц
Vincent Vegan
29
Всем привет, написал код ниже, но он выдает сегфолт, в чем причина? #include <stdio.h> #include <stdlib.h> #include <string.h> struct product { char *name; float price; };...
buzz базз
75
Dim Dim, [02.07.2024 11:07] DB 0x62 Dim Dim, [02.07.2024 11:07] DB 0x66 Dim Dim, [02.07.2024 11:07] кто пояснит что это?
Dim Dim
14
Ошибка: segmentation fault (core dumped) Код: pastebin.com/BEsNNSSV Сообщение от компилятора: отсутствует ОС: Arch Linux Ядро: x86_64 Linux 6.9.7-arch1-1 Процессор: Intel Cele...
sec
4
Ребят, а за скок можно впарить анон чат с апишкой и веб админкой ?
Eugene Неелов
15
Ещё такой вопрос. Мне необходимо хранить пароль пользователя локально. Для этого планирую использовать ini файл. Это для автозаполнения полей логин и пароль при авторизации. Е...
Евгений
19
Кстати, я тут еще с одной темой столкнулся, вот учу я C++, на таком то ресурсе, а остальные постоянно советуют практиковаться, что то писать, проекты, но как писать если вот т...
aaswq1
7
Коллеги, как получить PId для собственного процесса из под линукса?
Роман Лях (rgreat)
6
@ahndmn @ayaw0_0 здарова, на чем пишете?
Aiwan \ (•◡•) / _bot
7
Карта сайта