Я когда распознавал, использовал звуки. Для сравнения на датасете коммонвойса качество русского сильно хуже, чем башкирского. Так как для башкирского можно легко написать алгоритм конвертации между буквами и звуками
Даже при том, что объем датасета больше в 3-4 раза
Понял. Осмысляю. Тоесть если фонемная сложность языка превышает графемную , то нету смысла..
Точнее фонемы. Но потом эти фонемы требуется перевести в буквы и здесь будет проблема. А так внутри вав2век есть трансформер, который как раз позволяет корректно распознать "щека" и "сейчас" - если в исходной разметке такие слова присутствуют
Ну как написал выше не проблема
Обсуждают сегодня