этих ограничений выглядит так, что нужно взять предобученную сетку на соотв. языке (трансформер), прогнать разово, снять фичи, усреднить вектора, затем запустить PCA/как-то иначе сжать (через автоэнкодер тоже можно) и эти компоненты эмбеддинга подавать в катбуст. ИЛи на коллабе/кеггле тот же трансформер взять, доучить на классификацию последние слои, и предикты трансформера (логиты) подавать в катбуст с другими фичами
миллион в трейне. ну скорее всего задача заточена именно на сетки, но я так нормально в них и не разобрался. остановился на 3 модуле курса nlp от самсунга.
Обсуждают сегодня