И к слову, что подразумевается под Multi Label Classification? Это

когда нужно назначить объекту несколько меток из одного множества? Или это когда нужно назначить объекту n меток из n множеств? Я просто склоняюсь к первому варианту, а в таком случае всё обсуждение не имеет смысла

6 ответов

19 просмотров

Если не углубляться в подробности конкретно вашей задачи, то по идее если у вас будет достаточно сильных фичей, которые способны разделить 95-ый год от двухтысячных, то и классификатор « мондео vs сиера » справится с этим, так как в обучающей выборке не будет мондео из 90ых

В том то и дело, что сейчас наша модель делает много грубых ошибок типа «старая сиерра» вместо «новый Мондео» для правильного ответы «новый Фокус». На этапе тренировки мы знаем год выпуска каждой машины и хотим, чтобы «удалённость» ответа от правильного года выпуска влияла на оценочную функцию, тем самым помогая ей выбрать более оптимальное для нас решение. Мы хотим невозможного? Или же это уже смахивается на custom loss function?

Nick-Konovalchuk Автор вопроса

А как вам такой вариант: обучить модель, которая предсказывает год, а потом скармливать год в модель, которая предсказывает модель авто

Идея очень интересная. Мы попробуем на наших данных. А так вообще корректно делать с научной точки зрения? Или это больше как хак?

Nick-Konovalchuk Автор вопроса

Ну, можно сказать, что это своего рода стекинг. А стекинг практикуют

Я похожую идею реализовывал. Одна модель предсказывала фичу в датасете, а потом этот датасет с предсказанной фичей кормился второй модели. Проблема в том, что вторую модель нужно тренировать на тестовых данных первой модели, иначе будет лик\переобучение и толку мало

Похожие вопросы

Обсуждают сегодня

1. https://www.kaggle.com/code/ahmadrezagholami2001/housing-estimation-linear-regression 2. https://www.kaggle.com/code/ahmadrezagholami2001/uncovering-quality-in-wines-logis...
Ahmadreza
1
Hi! Could you please upvote my new notebook? thanks a lot. https://www.kaggle.com/code/melissamonfared/anime-character-generation-dsgan-gan
məru
4
upvote plz https://www.kaggle.com/code/bassetkerouche/swapping-face?scriptVersionId=207300096
benkerrouche Statoinary
1
-- Привет всем. -- Есть csv, проблема в том что он содержит очень много повторов по столбцам и по строкам. -- Решил перекинуть это в базу данных, чтобы было проще. Но я не ша...
Oleg Ivanov
1
Как считаете - вопрос на собесе: «Как быстрее всего запустить ec2 машину в aws (в чистом аккаунте) и показать вывод от любой команды с нее» не очень ли сложный для условного м...
Sergey
50
Господа, у меня вопрос. Что вообще такое этот ваш data science и data scientists? А то гуглю, а мне какую-то расплывчатую фигню говорят.
Inkosta
44
Исходя из ваших комментариев, получается, что чтобы получить марты в CH из данных в PG, неправильно тянуть сырые данные в CH и там их обрабатывать, лепить справочники и джойни...
unhingedlunatic
42
Hi could you please help me with my two new projects? https://www.kaggle.com/code/hesankazemnia/rice-image-classification-cnn-pytorch https://www.kaggle.com/code/hesankazemnia...
Hesan
6
hi, Can you upvote? https://www.kaggle.com/code/durjoychandrapaul/rag-q-a-system-by-langchain-huggingface-for-pdf?scriptVersionId=204704280
A
1
Could you upvote and comment please? https://www.kaggle.com/code/tatianapetrushkevich/beginner-images https://www.kaggle.com/code/tatianapetrushkevich/python-for-beginners1 ...
Tazziyana
7
Карта сайта