?
Все, что в общем доступе нашел (open-stt, golos и т.д.). По качеству разметки их я вот не уверен, надо проверить.
А целевой домен какой ? Попробуйте поучить модель на целевом звуке (хотя бы псевдо-размеченном).
open stt - не стоило использовать. Там много ошибочной разметки.
Обсуждают сегодня