215 похожих чатов

А зачем сравнять? на реальных данных они будут 50 на

50?

5 ответов

13 просмотров

модель оверфитить будет на простых моделях типо decision tree, поэтому

а можно вернуться к теме ребаланса классов? для тех, кто в танке: почему не нужно уравнивать классы? возьмем некоторый граничный датасет, в котором 100 вхождений одного класса приходится на 1 вхождение другого. тогда модель может и без обучения фигачить предсказание 1 класса, но ведь всем же очевидно, что мы будем получать высокий False positive? с accuracy будет все отлично, но эта метрика бесполезна в задачах с неравными классами recall будет очень высоким, а вот accuracy - страдать. итак, возвращаясь к самому началу: а почему классы можно не балансировать?

Сергей Ильин
а можно вернуться к теме ребаланса классов? для т...

Писали же, что в реальных данных классы тоже несбалансированы, а следовательно, балансить их в трейне – плохо

Valerii
Писали же, что в реальных данных классы тоже несба...

и что, что несбалансированы? поправьте меня, если я не прав: 1 класс - 100 штук примеров 2 класс - 1 пример модели проще всегда лупить “1 класс”, нет? но это же не правильно )

Сергей Ильин
и что, что несбалансированы? поправьте меня, если...

А что значит модель будет? Ведь мы настраиваем лог лосс, к примеру. Да, ему выгодней сделать вероятности для доминирующего класса как можно больше, согласен, но ведь и на малом классе он даст вероятность, но очень малую только. Так вот, теперь что модель будет давать на выходе, какой класс то есть, зависит, как я написал выше, от порога отнесения к классу 1. Этот порог выбираете вы, основываясь на трейн, берете его малым, вот и всё. Дальше просто модель работает с этим порогом всегда.

Похожие вопросы

Обсуждают сегодня

А чем вам питонисты не угодили?😂
.
79
Язык Си можно выучить за день? По книжке ANSI C на 230 страниц
Vincent Vegan
29
Всем привет, написал код ниже, но он выдает сегфолт, в чем причина? #include <stdio.h> #include <stdlib.h> #include <string.h> struct product { char *name; float price; };...
buzz базз
75
Есть какой-нибудь для Delphi/FPC T*Compression(Decompression)Stream на базе LZ4/Zstd/любой другой быстрый(и хорошо сжимающий) алгоритм А ещё лучше в pure pascal А ещё лучше од...
notme
32
Dim Dim, [02.07.2024 11:07] DB 0x62 Dim Dim, [02.07.2024 11:07] DB 0x66 Dim Dim, [02.07.2024 11:07] кто пояснит что это?
Dim Dim
14
Ошибка: segmentation fault (core dumped) Код: pastebin.com/BEsNNSSV Сообщение от компилятора: отсутствует ОС: Arch Linux Ядро: x86_64 Linux 6.9.7-arch1-1 Процессор: Intel Cele...
sec
4
Ещё такой вопрос. Мне необходимо хранить пароль пользователя локально. Для этого планирую использовать ini файл. Это для автозаполнения полей логин и пароль при авторизации. Е...
Евгений
19
Ребят, а за скок можно впарить анон чат с апишкой и веб админкой ?
Eugene Неелов
15
Кстати, я тут еще с одной темой столкнулся, вот учу я C++, на таком то ресурсе, а остальные постоянно советуют практиковаться, что то писать, проекты, но как писать если вот т...
aaswq1
7
А как лучше конвертировать физический адрес в виртуальный при маппинге? В случае ядра у меня, например, direct mapping, первые 768МБ я как есть мапплю в higher half, а остальн...
Evg Resh
26
Карта сайта