Кстати, стало интересно, кто как обходит кейс когда есть не

просто много категорий, но много категорий, связанных некой иерархией?

7 ответов

24 просмотра

а зачем модели знать эту иерархию? указываете как таргет самый нижний ярус да и все...

ну оптимизируйте тогда точность модели...

Если иерархию можно описать, например, бинарным деревом, то путь до категории в стиле 1010111( ноль-влево, один-вправо) раскладывается на категориальные фичи. Если глубина очень большая, то можно сделать эмбеддинги этих путей, сократив размерность до разумной

Или ещё вариант: у вас есть например категория: напитки/алкогольные/вино/Франция/сухое. Создайте из этого описания bag-of-words и либо прямо в таком виде добавьте в датасет, либо перевзвесьте по tf-idf, например, или как-то иначе.

BOGDAN- Автор вопроса

спасибо за приёмы, очень полезно. Я опустил уточнение в свете предшествующей беседы, но Меня интересовал вопрос таргета, а не фичи, мультиклассификации где классы связаны иерархией

@uberkinder если я вас правильно понял, то в качестве идеи попробуйте через многоклассовый классификатор угадать какой-нибудь базовый класс (например, сок) далее по этому классу добавьте его связи с другими классами в виде, например, графа в качестве фичей и учите мульти лэйбл.

BOGDAN- Автор вопроса

Спасибо

Похожие вопросы

Обсуждают сегодня

Hi! Could you please upvote my new notebook? thanks a lot. https://www.kaggle.com/code/melissamonfared/anime-character-generation-dsgan-gan
məru
4
upvote plz https://www.kaggle.com/code/bassetkerouche/swapping-face?scriptVersionId=207300096
benkerrouche Statoinary
1
-- Привет всем. -- Есть csv, проблема в том что он содержит очень много повторов по столбцам и по строкам. -- Решил перекинуть это в базу данных, чтобы было проще. Но я не ша...
Oleg Ivanov
1
Как считаете - вопрос на собесе: «Как быстрее всего запустить ec2 машину в aws (в чистом аккаунте) и показать вывод от любой команды с нее» не очень ли сложный для условного м...
Sergey
50
Господа, у меня вопрос. Что вообще такое этот ваш data science и data scientists? А то гуглю, а мне какую-то расплывчатую фигню говорят.
Inkosta
44
Hi could you please help me with my two new projects? https://www.kaggle.com/code/hesankazemnia/rice-image-classification-cnn-pytorch https://www.kaggle.com/code/hesankazemnia...
Hesan
6
Исходя из ваших комментариев, получается, что чтобы получить марты в CH из данных в PG, неправильно тянуть сырые данные в CH и там их обрабатывать, лепить справочники и джойни...
unhingedlunatic
42
hi, Can you upvote? https://www.kaggle.com/code/durjoychandrapaul/rag-q-a-system-by-langchain-huggingface-for-pdf?scriptVersionId=204704280
A
1
Could you upvote and comment please? https://www.kaggle.com/code/tatianapetrushkevich/beginner-images https://www.kaggle.com/code/tatianapetrushkevich/python-for-beginners1 ...
Tazziyana
7
Коллеги, приветствую! Появилась не совсем тривиальная задача реализовать в nginx редирект HTTPS —> HTTP. Да, именно так, а не наоборот. Мы разрабатываем embedded устройство,...
Никита
24
Карта сайта