Приветствую! Вопрос по использованию whisper: использую model large-v2 с настройкой --language

Question

Приветствую! Вопрос по использованию whisper: использую model large-v2 с настройкой --language

Russian для STT русскоязычной речи. Всё устраивает, но теперь хочу получать распознанный текст на английском языке. Вроде бы whisper такое умеет, означает ли это что достаточно задать --language English или всё же нужна где-то опция для задания языка аудио?

#it #russian #speech-recognition

0

09.10.2023

9 ответов

112 просмотров

Andre Park

Можно не чего не задавать, whisper автоматом определять язык умеет

0

09.10.2023

Anatoly Belov

Nikolay V. Shmyrev
Adding --task translate will translate the speech ...

и в таком случае whisper будет сразу и переводить на нужный язык? и даже по сегментам?

0

09.10.2023

Богдан Барабанщиков

Anatoly Belov
и в таком случае whisper будет сразу и переводить ...

Только на английский может переводить

0

09.10.2023

Anatoly Belov

Богдан Барабанщиков
Только на английский может переводить

увидел, спасибо )

0

09.10.2023

Anatoly Belov

Богдан Барабанщиков
Только на английский может переводить

попробовал whisper base c huggingface по кодам с huggingface перевод на английский с французского по обучающему примеру работает ) а как в этой модели штатным образом по сегментам делить ?

0

09.10.2023

Nikolay V. Shmyrev

Anatoly Belov
попробовал whisper base c huggingface по кодам с h...

по каким сегментам? По словам он делить не умеет, для этого есть whisperx

0

09.10.2023

Nikolay V. Shmyrev

Anatoly Belov
попробовал whisper base c huggingface по кодам с h...

можно изучить https://github.com/pranauv1/AI-Video-Translation

0

09.10.2023

Anatoly Belov

Nikolay V. Shmyrev
по каким сегментам? По словам он делить не умеет, ...

по сегментам - имелось ввиду тайминги, word_timestamps result = model.transcribe(source_file_name_channel + '.wav', language="de") segments = result['segments']

0

09.10.2023

Nikolay V. Shmyrev · Accepted Answer

Nikolay V. Shmyrev

Adding --task translate will translate the speech into English: whisper japanese.wav --language Japanese --task translate

0

09.10.2023

26 похожих чатов

Приветствую! Вопрос по использованию whisper: использую model large-v2 с настройкой --language

9 ответов

Похожие вопросы