точность должна быть score=(train=0.992, test=0.927)
перепроверяю через реальное обучение и выходит 93% или test это и есть оценка ?
С ручным поиском гиперпараметров добился точности классификации в 96%, пытаюсь увеличить результат
Тест это точность на неизвестных данных, а трейн — точность на учебных. То что точность на трейне выше, это нормально. Точность на трейне показывает насколько модель помнит то что видела при обучении. Но нас интересует точность на тесте, потому что при эксплуатации модели она будет видеть не то на чем училась
Про этот процесс я понимаю. Однако как выше сказал, добиваюсь точности в 96% ручным подбором гиперпараметров на тестовом датасете. Поэтому стало интересно почему так
Есть другие методы поиска. Grid search, random search. Попробуйте их. Можно еще попробовать проанализировать те гиперпараметры, что нашел алгоритм и те что вы сами нашли и понять, чем отличается и к чему приводит это отличие
Оптуна. Генетические алгоритмы
Ты в HalvingRandomSearchCV.fit подаешь тестовые данные?
Ты в HalvingRandomSearchCV.fit подаешь тестовые данные? - если да, то так некорректно делать, тестовые данные нужно использовать только для финальной оценки и больше ни для чего (в частности тюнить гиперпараметры руками подглядывая в тест тоже нельзя) - если нет, то твой результат адекватный, потому что алгоритм оптимизирует cv-метрику на train, а ты руками подбираешь параметры глядя на test (чего опять же нельзя делать). то есть если ты руками будешь оптимизировать метрику на тех же данных, что и алгоритм, то скорее всего ты ему проиграешь)
Нет, не тестовые. Понял
С генетическими алгоритмами еще не разобрался
Обсуждают сегодня