169 похожих чатов

Всем доброго дня, вопрос для практикующих ML: 1) вот есть у

меня "правильный" CV, это когда всякие там средние и прочие штуки - считаются строго на train-фолдах, а потом применяются на тест-фолде, через пайплайн, и вот пробую target-mean-encoding (и да, он smoothed) - реализовал, получил скор на CV и "чистом" тесте (модель этих данных не видела)

2) потом сделал такую штуку - когда весь трейн (внутри текущего сплита CV) бьется еще раз на фолды - и на них делается "правильный" target-mean-encoding (среднее таргета считаем по трейну, применяем на тестовом фолде), во внешнем CV для кодирования факторов в тестовом фолде применяем среднее по всему трейну. И вот во втором случае я получил хуже скор на CV и тесте, соразмерно. Вопрос - если у нас честный CV - а надо ли еще и трейн бить на фолды и там делать "правильный" target-mean-encoding?

самому думается, что если CV честный (все считаем без учета тестовой части) - то указанное выше делать не нужно

что думаете?

3 ответов

8 просмотров
Jury- Автор вопроса

вопрос актуален, все равно CV-скор ниже, если делаем фолды внутри фолдов для target mean encoding внутри train части внутри CV-итерации

Jury- Автор вопроса
Andrey
Не понял, в чем проблема

надо ли делать внутри CV-итерации для трейн части - еще раз разбивку на фолды, что бы применить target-mean-encoding проблема в том что если так делаю - скор хуже получается, как на CV так и на тесте (который модель не видела) CV - честный, через пайплайны

Похожие вопросы

Обсуждают сегодня

Всем привет, написал код ниже, но он выдает сегфолт, в чем причина? #include <stdio.h> #include <stdlib.h> #include <string.h> struct product { char *name; float price; };...
buzz базз
75
База данных не поможет. Шифрование не поможет. Какие там ещё варианты? Накидывайте.
КТ315
20
А табстоп это сообщение от окна или от элемента управления?
The Bird of Hermes
18
А как лучше конвертировать физический адрес в виртуальный при маппинге? В случае ядра у меня, например, direct mapping, первые 768МБ я как есть мапплю в higher half, а остальн...
Evg Resh
26
Открыл свой двухкилобайтный экзешник в x32dbg, а тут какая-то хрень. Смущает кнопка "выполнить до пользовательского кода", а что ещё может быть в файле помимо него ?
НѣкъиⰘижєжєиꙁъвьсєсвѣтьноѣсѣтиѥсть•
11
Мне были интересны дишные хаки и я нашёл любопытный способ на форуме через __traits, что-то вроде int delegate(int) fac = (int n) => n == 0 ? 1 : n * __traits(parent, {})(n - ...
Constantin F.
1
Вопрос тем кто смотрит видео и слушает подкасты - как вы потом ищете нужную вам информацию? Вот статью я прочитал, потом могу искать нужную мне часть банальным поиском. Пропус...
Aleksandr Druzhinin
4
Всем привет, подскажите/посоветуйте пожалуйста. Фаердак компоненты, имею одно место где бизнес хочет видеть при открытии формы список всех клиентов, это порядка 30к. Мои дово...
Sasha Sch
14
Ребят, если кто в курсе - скажите, а в загранке такое же засилье маркетплейсов? или там простые сермяжные интернет-магазины живут попроще?
Андрей [aharito] Харитонов
14
Коллеги, доброе утро. Запустил на удаленном хосте приложение (ручками зашел туда по ssh и запустил, не командой удаленно). Создал потом ssh-туннель, и с моей машины приложение...
Δημήτηρ
9
Карта сайта