Всем привет! Подскажите, пожалуйста, для поиска использую e5 с векторами 1024 float32 Качество поиска фича similarity между запросом и документом супер растит, но соответстве...
Всем привет! Делаю спеллчекер поисковых запросов и столкнулся со сложностями. Провел анализ одного оупенсорс спеллчекера по следующим тестам: Данные - 1500 популярных запросо...
Всем привет! Делаю поисковое ранжирование и в качестве текстовых фичей пихаю multilingual e5 для поискового запроса и для названия и описания объекта. В бустинг кладу по одном...
Всем привет! Подскажите, пожалуйста, есть ли какой-то метод приводить матерные слова в их исходники? Какая-то лемматизация матерных слов или приведение к начальной форме Приме...
Подскажите, пожалуйста, можно ли форсировать правильное распознавание имён собственных у воска или у немо? У виспера это норм работает с помощью промпта. Но интересно про воск...
Всем привет! Есть задача детекции присутствия музыки в аудиодорожке. Даже если человек говорит и в фоне у него музыка, то это нужно задетектить. Короче просто музыка либо фон...
Есть ли способы снизить галлюцинации виспера?
Всем привет! Такой вопрос. Каким образом правильнее всего приводить несколько канальный звук к одному каналу для нужд распознавания речи? Допустимо ли например взять один кан...
Всем привет! Делаю распознавание речи с помощью faster whisper и столкнулся с проблемой транскрибации аудио, в которых начало на русском языке, а потом говорят по английски. В...
Всем привет! Подскажите, пожалуйста, современные или знаковые модели speaker verification Хочу понять, как сейчас обучаются такие модели, какие сейчас лучшие практики для это...
Подскажите, пожалуйста, сколько примерно понадобится видеопамяти для инференса минимальной llama 2? На 1 А100 влезет?
Могут ли другие модели кроме виспера выдавать пунктуацию и капитализацию?
Всем привет, подскажите, пожалуйста, можно ли как то ускорить распознавание с помощью faster whisper на gpu? Запуск из ThreadPoolExecutor нескольких файлов увеличивает утилиза...
А как в таком случае лучше делать? Давать аудио и просить писать текст прям что слышат? И с помощью какого оупенсорс инструмента можно это делать?
Результаты distil whisper впечатляющие, но есть ли возможность как-то тайминги сегментов\слов доставать?
Всем привет! Подскажите, пожалуйста, есть ли возможность определения качества аудиозаписи? Хочется до распознавания проскорить аудио такой моделью и не делать распознавание в ...
Отлично, спасибо) А качество это сильно просаживает навскидку?
А e5 дообучали, или дефолтную?