и почему потом распределение меток не поедет в неизвестном направлении?
я так понял задача смещения состоит в правильном написании селекта при сборке витрины, сами объекты не меняются возраст не очень простой пример пусть будут категории людей с доходом: "высокий_доход", "средний" и "низкий" если в генеральной совокупности процентное соотнощение объектов по этим параметрам например 5%/15%/80%, а на размеченной выборке отличается, то нужно просто исходя из общего числа размеченных объектов пропорционально насэмплить выборку (например, отбросить лишние объекты) Разметка при этом никуда не едет Ну это я так вижу :)
Смотри, есть два отличающихся распределения построенных на признаках. Для одного из них есть разметка, для другого нет. Можно найти функцию которая генеральное распределение переводит в то, на котором училась модель (или наоборот, не важно). Когда к нам приходят новые примеры из генеральной совокупности для которых нужно сделать предикт таргета, мы сначала применяем к ним функцию которая меняет распределение этой генеральной совокупности, а потом применяем нашу модельку, потому что теперь входящее в нее распределение будет похоже на то, на котором она училась
Обсуждают сегодня