Russian для STT русскоязычной речи. Всё устраивает, но теперь хочу получать распознанный текст на английском языке. Вроде бы whisper такое умеет, означает ли это что достаточно задать --language English или всё же нужна где-то опция для задания языка аудио?
Adding --task translate will translate the speech into English: whisper japanese.wav --language Japanese --task translate
Можно не чего не задавать, whisper автоматом определять язык умеет
и в таком случае whisper будет сразу и переводить на нужный язык? и даже по сегментам?
Только на английский может переводить
увидел, спасибо )
попробовал whisper base c huggingface по кодам с huggingface перевод на английский с французского по обучающему примеру работает ) а как в этой модели штатным образом по сегментам делить ?
по каким сегментам? По словам он делить не умеет, для этого есть whisperx
можно изучить https://github.com/pranauv1/AI-Video-Translation
по сегментам - имелось ввиду тайминги, word_timestamps result = model.transcribe(source_file_name_channel + '.wav', language="de") segments = result['segments']
Обсуждают сегодня