Приветствую! Вопрос по использованию whisper: использую model large-v2 с настройкой --language

Russian для STT русскоязычной речи. Всё устраивает, но теперь хочу получать распознанный текст на английском языке. Вроде бы whisper такое умеет, означает ли это что достаточно задать --language English или всё же нужна где-то опция для задания языка аудио?

9 ответов

59 просмотров

Adding --task translate will translate the speech into English: whisper japanese.wav --language Japanese --task translate

Можно не чего не задавать, whisper автоматом определять язык умеет

Nikolay V. Shmyrev
Adding --task translate will translate the speech ...

и в таком случае whisper будет сразу и переводить на нужный язык? и даже по сегментам?

Богдан Барабанщиков
Только на английский может переводить

попробовал whisper base c huggingface по кодам с huggingface перевод на английский с французского по обучающему примеру работает ) а как в этой модели штатным образом по сегментам делить ?

Anatoly Belov
попробовал whisper base c huggingface по кодам с h...

по каким сегментам? По словам он делить не умеет, для этого есть whisperx

Anatoly Belov
попробовал whisper base c huggingface по кодам с h...

можно изучить https://github.com/pranauv1/AI-Video-Translation

Nikolay V. Shmyrev
по каким сегментам? По словам он делить не умеет, ...

по сегментам - имелось ввиду тайминги, word_timestamps result = model.transcribe(source_file_name_channel + '.wav', language="de") segments = result['segments']

Похожие вопросы

Обсуждают сегодня

Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Раз начали говорить про embassy, то присоединюсь со своими парой вопросов. 1) Есть ли сопоставимые аналоги для асинхронного кода в emdebbed? 2) Можно ли внутри задач embassy ...
NI_isx
6
Всем привет, нужна как никогда, нужна помощь с IO в загрузчике. Пишу в code16 после установки сегментных регистров, пишу вывод символа. Пробовал 2 варианта: # 1 mov $0x0E, %a...
Shadow Akira
14
Добрый вечер, Пока не совсем понимаю как наладить общение между телеграм ботом и ПО для работы с сим боксом. По самому боту так понял: - Нужен некий баланс, который можно поп...
Magic
6
Коллеги, я тут для личных нужд пошел ставить MQTT сервер, пощупал mosquitto, но ужаснулся отсутствию такой банальности, как HTTP API для посмотреть список топиков. А тут что,...
Maksim Lapshin
14
У меня задача: написать брокер сообщений. Очереди и потребители. Очереди поддерживают приоритеты. Очередь отдает сообщения, только обработчикам с соответствующими характеристи...
Aleksandr Filippov
2
Решил тут попробовать embassy на bluepill. Все установил, собрал blink и успешно залил с помощью St link 2 китайского. Но после этого чип шиться перестал. На форумах прочел, ч...
Lukutin R2AJP
6
Немного оффтопа: а кто на чем сидит для осдева в плане ide/редактора? Последнее время сидел на vscode, но я его прям не могу нормально воспринимать, перешел на сlion, но меня...
Evg Resh
29
Вопрос на перед, на следующую пятницу. Сколько строк кода можно вешать на одного программиста, понятно что если проект хорошо написан то можно и миллион. Но есть же где то пре...
AlekseyK Kluchnikov
31
Карта сайта