169 похожих чатов

Ребят привет. Мне нужно спарсить много (2тб) телефонных звонков. mp3

- > в текстовый файл. Хочу библиотеку подобрать Python. Посоветуйте кто сталкивался. Vosk или есть лучше аналоги?

31 ответов

73 просмотра

Whisper

Jin- Автор вопроса
Eduard
Whisper

Спасибо. Там токены и вроде ограничения по ним. 2 терабайта думаю лучше на локальной машине обработать

Eduard
Whisper

Но воском не пользовался, утверждать что он хуже виспера не буду

Jin- Автор вопроса
Eduard
Но воском не пользовался, утверждать что он хуже в...

А у wispera сколько на одном аке получалось достать текста? Помните?

Jin- Автор вопроса

Не, я по доброму. Просто с обработкой звука не работал раньше. Хочу посоветоваться, кто что знает. Что бы не переделывать потом под другую модель распознавания

Есть cuda - совсем хорошо, нет - на цпу посчитает.

Jin- Автор вопроса
Jin
Не, я по доброму. Просто с обработкой звука не раб...

Так в любом случае переделывать, если появляются более точные модели

Jin- Автор вопроса
Pavel Zheltouhov
Так в любом случае переделывать, если появляются б...

Ну тоже верно. Wisper все хвалят. Только у меня объем файлов mp3 огромный.

Jin
Ну тоже верно. Wisper все хвалят. Только у меня об...

Я бы с интересом ознакомился бы со сравнением Whisper с Яндексом (и Тиньковым). Все-таки они давно этим занимаются

Jin
Ну тоже верно. Wisper все хвалят. Только у меня об...

Кстати, у вас двухканальный mp3? Ну может вы еще не знаете, но оно надо

Jin
Ну тоже верно. Wisper все хвалят. Только у меня об...

Если для товарища майора это делаете то выбивайте бюджет

Jin- Автор вопроса
Pavel Zheltouhov
Кстати, у вас двухканальный mp3? Ну может вы еще ...

Думаю в моно. 1 канал. Там записи звонков менеджеров компании за 2 года

Jin
Думаю в моно. 1 канал. Там записи звонков менеджер...

Так идите сразу ругайтесь, чтобы делали стерео. Очевидно же.

Jin- Автор вопроса
Eduard
Если для товарища майора это делаете то выбивайте ...

Не) у нас программа переобучения менеджеров. Продажников будут учить на их же ошибках

Jin- Автор вопроса
Pavel Zheltouhov
Так идите сразу ругайтесь, чтобы делали стерео. Оч...

Надо стерео? Понял. Спасибо за подсказку. Уделю этому внимание

Jin- Автор вопроса
Pavel Zheltouhov
Я бы с интересом ознакомился бы со сравнением Whis...

Если проведу такой опыт, то поделюсь. Как бы не забыть только?))) если хотите, добавьте меня в личку. Попозже спишимся

Pavel Zheltouhov
Так идите сразу ругайтесь, чтобы делали стерео. Оч...

Я диктофонное моно обрабатывал - вроде все нормально было

Jin- Автор вопроса
Eduard
Я диктофонное моно обрабатывал - вроде все нормаль...

Мне кажется что по умолчанию звонки и диктофоны пишутся в моно

Это не технологический момент, а информационный. Просто разумно иметь в данных признак кто что сказал, а не просто сплошной текст

Jin- Автор вопроса
Pavel Zheltouhov
Это не технологический момент, а информационный. П...

Да, следующий момент. Я пока его не трогаю, есть два варианта на примете. Попробовать как то инициалищировать тембр голоса например по частотам и обработанный язык писать с ключами менеджер : клиент

Pavel Zheltouhov
Это не технологический момент, а информационный. П...

Насколько помню виспер спикеров не разделяет.

Jin
Думаю в моно. 1 канал. Там записи звонков менеджер...

Оо, у меня есть схожая с вашей задача. Есть записи телефонных разговоров отдела продаж за 3 года в mp3. Было бы неплохо перегнать это в текст, и проанализировать на предмет: что чаще спрашивают клиенты, где косячат менеджеры Проблема в том, что я пока не знаю как перегнать аудио в текст и как дальше подступиться к анализу естественного языка

Jin- Автор вопроса
Nail Galimov
Оо, у меня есть схожая с вашей задача. Есть записи...

Да, моя задача такая же. Ну вроде решается. Дорогу осилит идущий

Jin- Автор вопроса
Jin
Да, моя задача такая же. Ну вроде решается. Дорогу...

Если с мат статистикой дружите, то думаю, найти зависимости после "перегонки" - дело времени

Jin
Если с мат статистикой дружите, то думаю, найти за...

Ну как сказать дружу. Я вроде технарь, дружу с математикой, в универе давныыыым-давно был курс матана :) Но я ни разу не аналитик данных, я маркетолог. Просто такая задача была бы полезна в текущей работе с клиентом. А аналитика, кто бы мог этим заняться нет. Могу в личку написать в случае если возникнут проблемы?

Jin- Автор вопроса
Nail Galimov
Ну как сказать дружу. Я вроде технарь, дружу с мат...

Да. К тому же готовое решение думаю уже будет

Jin- Автор вопроса
Kim Young
Ну и? Ставишь локально и поехали

😊😊😊 На гит хабе исходники. Попробую, что за зверь)

Jin
😊😊😊 На гит хабе исходники. Попробую, что за зверь)

https://t.me/alternative_service/61 гляьте тут. Есть от OpenAI релиз, но посмотрите еще whisper.cpp, он недавно расширился поддержкой GPU, перегонять файлы по циклу может быть удобнее и быстрее, чем тащить либу на питоне, в репе есть пункт про скорость работы

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта