и трактовке предиктов бустинга. Я не очень понял, помимо попытки объяснить предикт вкладом каждого предиктора, как Шепли использовать для выбора набора предикторов? Ясно, что предикторы можно отранжировать, а как выбрать значение отсечки слабых/избыточных?
В дефолтном варианте ни как. Но можно как в боруте докинуть фичи с случайно перемешанными строчками от других колонок. Такие переменные называют теневыми. Если у какой-то из исходных переменных важность ниже чем у теневой, то она объективно не лучше шума
Обсуждают сегодня