169 похожих чатов

Ребят привет. Мне нужно спарсить много (2тб) телефонных звонков. mp3

- > в текстовый файл. Хочу библиотеку подобрать Python. Посоветуйте кто сталкивался. Vosk или есть лучше аналоги?

31 ответов

31 просмотр

Whisper

Jin- Автор вопроса
Eduard
Whisper

Спасибо. Там токены и вроде ограничения по ним. 2 терабайта думаю лучше на локальной машине обработать

Eduard
Whisper

Но воском не пользовался, утверждать что он хуже виспера не буду

Jin- Автор вопроса
Eduard
Но воском не пользовался, утверждать что он хуже в...

А у wispera сколько на одном аке получалось достать текста? Помните?

Jin- Автор вопроса

Не, я по доброму. Просто с обработкой звука не работал раньше. Хочу посоветоваться, кто что знает. Что бы не переделывать потом под другую модель распознавания

Есть cuda - совсем хорошо, нет - на цпу посчитает.

Jin- Автор вопроса
Jin
Не, я по доброму. Просто с обработкой звука не раб...

Так в любом случае переделывать, если появляются более точные модели

Jin- Автор вопроса
Pavel Zheltouhov
Так в любом случае переделывать, если появляются б...

Ну тоже верно. Wisper все хвалят. Только у меня объем файлов mp3 огромный.

Jin
Ну тоже верно. Wisper все хвалят. Только у меня об...

Я бы с интересом ознакомился бы со сравнением Whisper с Яндексом (и Тиньковым). Все-таки они давно этим занимаются

Jin
Ну тоже верно. Wisper все хвалят. Только у меня об...

Кстати, у вас двухканальный mp3? Ну может вы еще не знаете, но оно надо

Jin
Ну тоже верно. Wisper все хвалят. Только у меня об...

Если для товарища майора это делаете то выбивайте бюджет

Jin- Автор вопроса
Pavel Zheltouhov
Кстати, у вас двухканальный mp3? Ну может вы еще ...

Думаю в моно. 1 канал. Там записи звонков менеджеров компании за 2 года

Jin
Думаю в моно. 1 канал. Там записи звонков менеджер...

Так идите сразу ругайтесь, чтобы делали стерео. Очевидно же.

Jin- Автор вопроса
Eduard
Если для товарища майора это делаете то выбивайте ...

Не) у нас программа переобучения менеджеров. Продажников будут учить на их же ошибках

Jin- Автор вопроса
Pavel Zheltouhov
Так идите сразу ругайтесь, чтобы делали стерео. Оч...

Надо стерео? Понял. Спасибо за подсказку. Уделю этому внимание

Jin- Автор вопроса
Pavel Zheltouhov
Я бы с интересом ознакомился бы со сравнением Whis...

Если проведу такой опыт, то поделюсь. Как бы не забыть только?))) если хотите, добавьте меня в личку. Попозже спишимся

Pavel Zheltouhov
Так идите сразу ругайтесь, чтобы делали стерео. Оч...

Я диктофонное моно обрабатывал - вроде все нормально было

Jin- Автор вопроса
Eduard
Я диктофонное моно обрабатывал - вроде все нормаль...

Мне кажется что по умолчанию звонки и диктофоны пишутся в моно

Это не технологический момент, а информационный. Просто разумно иметь в данных признак кто что сказал, а не просто сплошной текст

Jin- Автор вопроса
Pavel Zheltouhov
Это не технологический момент, а информационный. П...

Да, следующий момент. Я пока его не трогаю, есть два варианта на примете. Попробовать как то инициалищировать тембр голоса например по частотам и обработанный язык писать с ключами менеджер : клиент

Pavel Zheltouhov
Это не технологический момент, а информационный. П...

Насколько помню виспер спикеров не разделяет.

Jin
Думаю в моно. 1 канал. Там записи звонков менеджер...

Оо, у меня есть схожая с вашей задача. Есть записи телефонных разговоров отдела продаж за 3 года в mp3. Было бы неплохо перегнать это в текст, и проанализировать на предмет: что чаще спрашивают клиенты, где косячат менеджеры Проблема в том, что я пока не знаю как перегнать аудио в текст и как дальше подступиться к анализу естественного языка

Jin- Автор вопроса
Nail Galimov
Оо, у меня есть схожая с вашей задача. Есть записи...

Да, моя задача такая же. Ну вроде решается. Дорогу осилит идущий

Jin- Автор вопроса
Jin
Да, моя задача такая же. Ну вроде решается. Дорогу...

Если с мат статистикой дружите, то думаю, найти зависимости после "перегонки" - дело времени

Jin
Если с мат статистикой дружите, то думаю, найти за...

Ну как сказать дружу. Я вроде технарь, дружу с математикой, в универе давныыыым-давно был курс матана :) Но я ни разу не аналитик данных, я маркетолог. Просто такая задача была бы полезна в текущей работе с клиентом. А аналитика, кто бы мог этим заняться нет. Могу в личку написать в случае если возникнут проблемы?

Jin- Автор вопроса
Nail Galimov
Ну как сказать дружу. Я вроде технарь, дружу с мат...

Да. К тому же готовое решение думаю уже будет

Jin- Автор вопроса
Kim Young
Ну и? Ставишь локально и поехали

😊😊😊 На гит хабе исходники. Попробую, что за зверь)

Jin
😊😊😊 На гит хабе исходники. Попробую, что за зверь)

https://t.me/alternative_service/61 гляьте тут. Есть от OpenAI релиз, но посмотрите еще whisper.cpp, он недавно расширился поддержкой GPU, перегонять файлы по циклу может быть удобнее и быстрее, чем тащить либу на питоне, в репе есть пункт про скорость работы

Похожие вопросы

Обсуждают сегодня

@MrMiscipitlick А можешь макрос написать, который будет вычислять смещение относительно переданных меток? Просто .label1-.label2, и вернуть значение.
КТ315
35
я не магистр хаскеля, но разве не может лейзи тип конвертнуться в не-лейзи запросив вычисление содержимого прям при инициализации?
deadgnom32 λ madao
100
А еще в перле можно уже @arr1 + @arr2?
Sergei Zhmylove
53
Подобного рода ;Следующие три строки это директивы ассемблера, ;которые можно не задавать, т.к.работаем в Visual Studio. ;Символ ";" - это начало однострочного комментария ...
Егор Анелькин
3
Привет всем. появился вопрос. Разрабатываю сайт, в данный момент он запущен. Хостинг beget. Добавляю на сайт яндекс метрику с помощью полей client-settings (взято отсюда http...
Andrew
2
Подскажите, где смотреть результат выполнения программы? Код: ;.686 ;Система команд процессора 686 ;.MODEL FLAT,stdcall ;Модель памяти плоская, станда...
Егор Анелькин
5
еще вопрос, допустим мы создадим char массив из 10 элементов и присвоим ему через сканф 10 символов. и выведем все символы. Хотел спросить последний элемент /0 будет включать...
Anthem
11
открыть папку в проводнике: 1 - ShellExecute 2 - ExecuteProcess 3 - OpenDocument что лучше выбрать?
Alexey Kulakov
12
Изменение типа с SomeException на String и правда удобней @cheese_hs . А вот такой вариант насколько некрасив еще? loadConfigDB :: IO (Either String ConfigDataBase) loadConfi...
Camara
7
Где в Астане можно купить мясо для шашлыков?
Dancing Іңұқәһүғө
21
Карта сайта