подскажите, плиз, что посоветуете почитать-изучить по рекомендации пользователю текстового контента на основе истории чтения других текстов? похожесть юзеров, объединение в кл...
@cointegrated Давид, это про вашу разработку? ))
и теперь в браузере если 0.0.0.0:8765 вбить то тишина? у меня заработало
Обучаю Conformer, библиотека NeMo, learning rate ведёт себя вот таким странным образом. Что я делаю не так?
А что просто посчитать недостаточно? Начало слова взять из предикта акустики + если кенлм поменял, то пересчитать с учетом новой длины слова
На такой конфигурации реально получить 50 RT для 8khz двухканального аудио? Как считаете? Процессор – 2 × Intel Silver 4314 (2.4 ГГц, 32 ядра) Память – 256 ГБ (16 × 16 ГБ DDR...
Подскажите, пожалуйста, что сейчас sota для создания эмбеддингов русского текста на юридическом домене (законы, бухгалтерия, кадры)? Задача - найти ближайших к источнику (заго...
Поделитесь опытом как перейти от offline распознавания файлов (docker+fastapi+fairseq) в online. Или хотя бы приблизиться к этому. Какие кто использует сервисы, модули?
В каком облаке проще всего развернуть модель распознавания с 1 GPU? Я правильно понял, что требуется запрос на квоту? И какие вендоры предоставляют расчёт по времени использов...
Новая модель для перевода от FB. На какую карту она влезет? Вес модели 17,5 Gb🤷♂️ https://twitter.com/psuraj28/status/1459546962571587591?t=oevGBOtfEDQ8EGby5iOFbw&s=19
Вопрос наверное глупый, но сходу не нашёл ответа на вопрос - как дообученную NER модель от deeppavlov запустить из докера? Дообучил ner_rus_bert_torch на нижний регистр.
Подскажите, в каком направлении двигаться чтобы решить задачу предсказания. Данные - поминутные числа с датчиков. Итог - одно число (в час) Как всё это нормально подготовить в...
Пробовал кто-то в BM25 использовать токенайзер, а не сплит по словам? 🤔
Наткнулся на интересную библиотеку https://github.com/fhamborg/Giveme5W1H Может кто-то встречал такое в свежем исполнении? Extraction of the journalistic five W and one H que...
Добрый день. Подскажите, пожалуйста, как грамотно решить задачу классификации сигналов? Данные получаю уже отфильтрованные, в виде батча - ширина канала×длина×3. Для обучения ...
Эту статью обсуждали здесь? ConVoice: Real-Time Zero Shot Voice Style Transfer https://arxiv.org/pdf/2005.07815.pdf
Подскажите, пожалуйста, какие можно статьи (примеры) почитать про внедрение распознавания в Asterisk? Как его поженить с RESTом хочется понять.
Как просчитываете железо для реалтайма для ASR? Может есть статейки какие-то, или либы для примерного расчёта
Какие изображения?
Есть в открытом доступе большой датасет НЕразмеченных аудио на русском языке? Желательно пошумнее. Появилось время попробовать итеративную разметку для wav2vec.