Добрый день! Подскажите пожалуйста есть ли открытые модельки или доступные по API, которыми можно генерировать разговаривающее лицо человека по картинке?
Ребят, а подскажите, пожалуйста, задача диаризации является специфичной для языка или модели, которые работают для английского, применимы и для русского?
Подскажите, пожалуйста, при обучении wav2vec2 используя в качестве языковой модели N-граммную модель она же должна влиять на подсчет лосс функции (т.е. фунцкия будет считаться...
Ребят, а подскажите, пожалуйста, из-за чего затюненый вав2век2 для одного и того же примера при каждом запуске предсказывает разные результаты ?