просто много категорий, но много категорий, связанных некой иерархией?
а зачем модели знать эту иерархию? указываете как таргет самый нижний ярус да и все...
ну оптимизируйте тогда точность модели...
Если иерархию можно описать, например, бинарным деревом, то путь до категории в стиле 1010111( ноль-влево, один-вправо) раскладывается на категориальные фичи. Если глубина очень большая, то можно сделать эмбеддинги этих путей, сократив размерность до разумной
Или ещё вариант: у вас есть например категория: напитки/алкогольные/вино/Франция/сухое. Создайте из этого описания bag-of-words и либо прямо в таком виде добавьте в датасет, либо перевзвесьте по tf-idf, например, или как-то иначе.
спасибо за приёмы, очень полезно. Я опустил уточнение в свете предшествующей беседы, но Меня интересовал вопрос таргета, а не фичи, мультиклассификации где классы связаны иерархией
@uberkinder если я вас правильно понял, то в качестве идеи попробуйте через многоклассовый классификатор угадать какой-нибудь базовый класс (например, сок) далее по этому классу добавьте его связи с другими классами в виде, например, графа в качестве фичей и учите мульти лэйбл.
Спасибо
Обсуждают сегодня