несколько категориальных признаков и целевая переменная-вероятность (ее значение должно быть в диапазоне от 0 до 1).
Я знаю среднее значение целевой переменной, допустим 0.15.
И по каждому значению каждого признака знаю среднее значение целевой переменной. Например, у объектов, у которых признак 1 равен А, среднее значение целевой переменной будет 0.3, если признак 1 равен Б, то 0.05 и так далее по остальным признакам.
Как обладая такой информацией, наиболее верно предсказывать значение целевой переменной для новых объектов?
https://www.coursera.org/lecture/competitive-data-science/concept-of-mean-encoding-b5Gxv
https://maxhalford.github.io/blog/target-encoding/
Обсуждают сегодня