Всем привет! Подскажите, пожалуйста, для поиска использую e5 с векторами 1024 float32 Качество поиска фича similarity между запросом и документом супер растит, но соответстве...
Всем привет! Делаю спеллчекер поисковых запросов и столкнулся со сложностями. Провел анализ одного оупенсорс спеллчекера по следующим тестам: Данные - 1500 популярных запросо...
Всем привет! Делаю поисковое ранжирование и в качестве текстовых фичей пихаю multilingual e5 для поискового запроса и для названия и описания объекта. В бустинг кладу по одном...
Подскажите, пожалуйста, можно ли форсировать правильное распознавание имён собственных у воска или у немо? У виспера это норм работает с помощью промпта. Но интересно про воск...
Всем привет! Подскажите, пожалуйста, есть ли какой-то метод приводить матерные слова в их исходники? Какая-то лемматизация матерных слов или приведение к начальной форме Приме...
Всем привет! Есть задача детекции присутствия музыки в аудиодорожке. Даже если человек говорит и в фоне у него музыка, то это нужно задетектить. Короче просто музыка либо фон...
Есть ли способы снизить галлюцинации виспера?
Всем привет! Такой вопрос. Каким образом правильнее всего приводить несколько канальный звук к одному каналу для нужд распознавания речи? Допустимо ли например взять один кан...
Результаты distil whisper впечатляющие, но есть ли возможность как-то тайминги сегментов\слов доставать?
Всем привет! Подскажите, пожалуйста, современные или знаковые модели speaker verification Хочу понять, как сейчас обучаются такие модели, какие сейчас лучшие практики для это...
А как в таком случае лучше делать? Давать аудио и просить писать текст прям что слышат? И с помощью какого оупенсорс инструмента можно это делать?
Всем привет! Делаю распознавание речи с помощью faster whisper и столкнулся с проблемой транскрибации аудио, в которых начало на русском языке, а потом говорят по английски. В...
Подскажите, пожалуйста, сколько примерно понадобится видеопамяти для инференса минимальной llama 2? На 1 А100 влезет?
Могут ли другие модели кроме виспера выдавать пунктуацию и капитализацию?
Всем привет, подскажите, пожалуйста, можно ли как то ускорить распознавание с помощью faster whisper на gpu? Запуск из ThreadPoolExecutor нескольких файлов увеличивает утилиза...
Отлично, спасибо) А качество это сильно просаживает навскидку?
Всем привет! Подскажите, пожалуйста, есть ли возможность определения качества аудиозаписи? Хочется до распознавания проскорить аудио такой моделью и не делать распознавание в ...
А e5 дообучали, или дефолтную?