215 похожих чатов

Коллеги у меня с одной стороны общий, но с другой

- экзотический вопрос. Проблема: В фичи "проникает" output. Тот самый который нужно прогнозировать (моя задача - прогноза, а не классификации). Понятно, что есть проблема мультиколлинераности. Но как я понимаю, она обсуждается и решается в контексте мультиколлинераности фичей. Например для линейных моделей ridge regression (самостоятельно или в рамках elatsic net). А вот случайное попадание (подмешивание) output, т.е. того, что нужно прогнозировать, в фичи - не обсуждается. Нехарактерная проблема. В силу того, что объём данных для обработки у меня огромный (много-много моделей, всё строится автоматом, не в какой то REPL, а-ля Jupyter) и ручной отбор проделать невозможно возниает эта проблема. Какие варианты решения? В ситуации с деревьями например или NN. Считаю (в моём случае), что в худшем случае output подмешивается линейно к фичам, в лучшем - отдельной фичей с лёгким шумом (последний случай - простой, я его решаю предельно тупо). Возможно я что то упускаю из вида банальное. Любые мысли хороши. Thx

2 ответов

10 просмотров

так а что здесь нехарактерного? типичная проблема

А в реальном мире такой "проблемы" нет? Если нет - добавить к фичам немного шума, убрать самые близкие фичи, выделять test set ASAP и желательно из другого источника. А вообще - в чём причина такого "проникновения"?

Похожие вопросы

Обсуждают сегодня

Всем привет, написал код ниже, но он выдает сегфолт, в чем причина? #include <stdio.h> #include <stdlib.h> #include <string.h> struct product { char *name; float price; };...
buzz базз
75
База данных не поможет. Шифрование не поможет. Какие там ещё варианты? Накидывайте.
КТ315
20
А табстоп это сообщение от окна или от элемента управления?
The Bird of Hermes
18
А как лучше конвертировать физический адрес в виртуальный при маппинге? В случае ядра у меня, например, direct mapping, первые 768МБ я как есть мапплю в higher half, а остальн...
Evg Resh
26
Открыл свой двухкилобайтный экзешник в x32dbg, а тут какая-то хрень. Смущает кнопка "выполнить до пользовательского кода", а что ещё может быть в файле помимо него ?
НѣкъиⰘижєжєиꙁъвьсєсвѣтьноѣсѣтиѥсть•
11
Мне были интересны дишные хаки и я нашёл любопытный способ на форуме через __traits, что-то вроде int delegate(int) fac = (int n) => n == 0 ? 1 : n * __traits(parent, {})(n - ...
Constantin F.
1
Вопрос тем кто смотрит видео и слушает подкасты - как вы потом ищете нужную вам информацию? Вот статью я прочитал, потом могу искать нужную мне часть банальным поиском. Пропус...
Aleksandr Druzhinin
4
Всем привет, подскажите/посоветуйте пожалуйста. Фаердак компоненты, имею одно место где бизнес хочет видеть при открытии формы список всех клиентов, это порядка 30к. Мои дово...
Sasha Sch
14
Ребят, если кто в курсе - скажите, а в загранке такое же засилье маркетплейсов? или там простые сермяжные интернет-магазины живут попроще?
Андрей [aharito] Харитонов
14
Всем привет. Нужна платная консультация от тех, кто сталкивался с октябрём в кластере или шарит оч хорошо в цмс. Проблема следующая: после переноса в кластер октябрь начал ...
wl
8
Карта сайта