215 похожих чатов

Хм, дамы и господа, подскажите, пожалуйста. Скорее всего, из банковской

сферы. Предположим, я хочу сделать модель регрессии, в которой будет около 50 предикторов, но я хочу её сделать не менее точной, чем сейчас мой случайный неинтерпретируемый лес. Он даёт мне sMAPE в 10%. Куда копать? Что читать?
В принципе, можно взять и во всех деревьях посчитать, куда в среднем переменная сдвигает значение целевой переменной, но это всё же не настолько интерпретируемо, наверное. как мне хотелось бы.

5 ответов

3 просмотра

Таргет энкодинг + простая модель. Для задач классификации часто используется woe-биннинг, когда переменные бьются на насколько бинов, затем эти бины объединяются между собой так, чтобы обеспечить монотонность признака по таргету. Ну и собственно бины кодируется woe (определённая статистика над таргетом, которая имеет рисковую интерпретацию). Такой подход в ряде случаев прокачивает линейную модель до уровня бустинга и делает ее даже более стабильной. Но есть проблема, для задачи регрессии нет готовой реализации биннинга. Закодировать можно и средним значением. Биннинг + монотонность можно получить из лгбм с одним деревом и ограничением на монотонность. Но это все не так тривиально. Если идти по пути просто таргет энкодинга (то есть без применения его к непрерывным переменным при помощи биннинга), то надо разные стратегии проверять, использовать двойную кросс-валидацию и так далее. В общем не самое простое занятие.

Eva-Shelley Автор вопроса

Хм, про дистилляцию деревом интересно. Да, я как-то glm упустил из виду, надо будет попробовать. Спасибо!

Eva-Shelley Автор вопроса
Дмитрий Симаков
Таргет энкодинг + простая модель. Для задач клас...

Да, я таргет-энкодинг взял из катбуста, он у них крутой. А вот насчёт биннинга непрерывных переменных действительно надо посмотреть, спасибо!

Eva Shelley
Да, я таргет-энкодинг взял из катбуста, он у них к...

Инфу про кэтбуст проверял на практике?) Ни на что не намекаю, но мало ли.

Eva-Shelley Автор вопроса

Похожие вопросы

Обсуждают сегодня

@MrMiscipitlick А можешь макрос написать, который будет вычислять смещение относительно переданных меток? Просто .label1-.label2, и вернуть значение.
КТ315
35
я не магистр хаскеля, но разве не может лейзи тип конвертнуться в не-лейзи запросив вычисление содержимого прям при инициализации?
deadgnom32 λ madao
100
А еще в перле можно уже @arr1 + @arr2?
Sergei Zhmylove
53
Подобного рода ;Следующие три строки это директивы ассемблера, ;которые можно не задавать, т.к.работаем в Visual Studio. ;Символ ";" - это начало однострочного комментария ...
Егор Анелькин
3
Привет всем. появился вопрос. Разрабатываю сайт, в данный момент он запущен. Хостинг beget. Добавляю на сайт яндекс метрику с помощью полей client-settings (взято отсюда http...
Andrew
2
Подскажите, где смотреть результат выполнения программы? Код: ;.686 ;Система команд процессора 686 ;.MODEL FLAT,stdcall ;Модель памяти плоская, станда...
Егор Анелькин
5
еще вопрос, допустим мы создадим char массив из 10 элементов и присвоим ему через сканф 10 символов. и выведем все символы. Хотел спросить последний элемент /0 будет включать...
Anthem
11
открыть папку в проводнике: 1 - ShellExecute 2 - ExecuteProcess 3 - OpenDocument что лучше выбрать?
Alexey Kulakov
12
Изменение типа с SomeException на String и правда удобней @cheese_hs . А вот такой вариант насколько некрасив еще? loadConfigDB :: IO (Either String ConfigDataBase) loadConfi...
Camara
7
Только сейчас дошли руки до Orange pi 5. Это нормально что на нем YOLOv5s выдает 1 кадр раз в 2-3 секунды на CPU? Это без оптимизаций и прочих настроек, просто голый запуск че...
Denis
10
Карта сайта