предобучению моделей на неразмеченных данных в стиле берта? кроме банальных автокодировщиков (обучил что-то типа AE на спектрограммах с масками - результаты так себе)
Facebook не так давно выкладывал сетку с обучением почти без учителя https://habr.com/ru/news/t/558784/
Этот метод далёк от BERTоподбного обучения, но на данный момент - единственный unsupervised.
Обсуждают сегодня