Привет. Ищу полезную инфу, подсказки или критику. Есть проект по ASR. На данных заказчика обкатали несколько SOTA ASR моделек, лучше всего себя показал Whisper Large V2. Из т...
а кто-то может подсказать, как это получше обсчитать? сейчас идея прикинуть FLOPs от какого-нибудь сетапа а-ля 8xA100 для интересующих нас архитектур и показать сколько камней...
Есть записи длинные по минуте-две на русском с расшифровками, телефония. Хотелось бы шинкануть их на записи по <=20-25 секунд. В принципе склоняюсь к варианту вручную разбить...
Ребят, привет! Подскажите, пожалуйста, есть ли у кого-то опыт реализации UI-стендов для SBS-тестирования TTS моделек и автоматического сбора метрик. Хотелось бы внутри команды...
у меня еще на эту тему есть вопрос к коллегам в чате. как помочь модели выговаривать русские окончания типа «ого» -> «о|ава»? есть какие-то словари или что-то накручиваете пов...
не могу, постоянно думаю об этом. есть может у кого идеи как можно такой сделать кайфовый мультиязычный синтез?
Ребята, всем привет! Тут вроде можно нубские вопросы задавать… Часто изучая проекты по ASR и TTS вижу, что в корпусах смело меняют слова с «ё» не е, приводят к «е», короче гов...
ребят, кто-то обучал сетки ASR/TTS на процессорах Xeon, мб даже на CPU-кластерах из Xeon? напишите, пожалуйста, в личку, если вдруг у вас был такой специфический опыт
Впрочем, насчет стиля не уверен, там про просодию было. Так понимаю, у вас всё же к тексту больше привязка или ошибаюсь?
кстати, я тут мало кого, наверное, этим видосом удивлю, но мне в нюансы реализации TTS под русский неоднократно помогал погрузиться вот этот видос: https://youtu.be/bogExcr0PD...
а можно контекст — зачем вообще такую задачку решаешь, если не секрет?
А что сейчас сота в SVC?