нагуглить решение
Есть объекты (клиенты-люди), описанные атрибутами - генеральная совокупность
У атрибутов генеральной совокупности (допустим, соцдем: пол, возраст, семейное положение и т.д.) есть распределение значений
Также существует процесс, в рамках которого части объектов генеральной совокупности присваивается метка (для простоты 0/1)
Задача - размножить эту метку на всю генеральную совокупность (бинарная классификация)
Если рассматривать только размеченные данные, то распределения значений атрибутов оказываются смещенными относительно генеральной совокупности (например, средний возраст клиента в генеральной совокупности - 35 лет, на размеченной выборке средний возраст - 29 лет)
Каким образом можно собрать на размеченных данных (насэмплить) датасет для обучения так, чтобы распределения определенных (ключевых) атрибутов повторяло оное у генеральной совокупности?
Может получится растянуть/сжать/подвинуть распределение с разметкой так что бы оно совпало с генеральной совокупностью
Обсуждают сегодня