170 похожих чатов

React — русскоговорящее с...

Android Developers

Python

Vue.js — русскоговорящее ...

Node.js — русскоговорящее...

DevOps — русскоговорящее ...

JavaScript Noobs — сообще...

Django [ru]

Go-go!

Angular - русскоговорящее...

ntwrk

Верстка сайтов HTML/CSS/J...

phpGeeks

Kubernetes — русскоговоря...

Битрикс для разработчиков

MODX. Русскоязычное сообщ...

pgsql – PostgreSQL

Laravel Pro

iOS Developers — русского...

ClickHouse не тормозит

Rust — русскоговорящее со...

JavaScript — русскоговоря...

С#

pro.cxx

pro.jvm

React Native — русскогово...

Devs Chat

Docker — русскоговорящее ...

HTML/CSS — русскоговоряще...

Python beginners

🐧 RU.UBUNTU — Официальное...

Kotlin Community

Embedded Group

Чат экстремального погром...

Клуб Vue.js-разработчиков

Xamarin Developers (MAUI,...

F# Chat

Svelte [svelt] - All abou...

Системное администрирован...

Nuxt.js | Vue SSR

var chat = new Chat();

Data Science Chat

Ассемблер

Android Architecture

Laravel для начинающих

Церковь метрик

Dart & Flutter

QA — русскоговорящее сооб...

R (язык программирования)

learn.java

DevsHelper

Big Data Science :: AI / ...

Delphi & Lazarus

SwiftBook

Solidity Development

Evolution CMS официальное...

pro.net (former COM+)

OpenStreetMap RU

Visual Studio Code — русс...

ru_mysql

pro.lua

Dart / Flutter

GraphQL — русскоговорящее...

pro.Asm

IDE и редакторы — русског...

OpenCartForum - 🇺🇦🇪🇺Чат O...

Angular.js (1.x) — русско...

Frontend_ru

Lame C

Flutter Developers — русс...

AutoIT RU

AI / Искусственный Интелл...

dlang.ru

Laravel Framework Russian...

WebPwnChat

Чат — Верстка Сайтов и Фр...

pro.python

Java Underground

Natural Language Processi...

javascript_ru

SqlCom.ru - сообщество MS...

Cinema 4D

Delphi Community

pro.vim

Server Side Swift Develop...

Autohotkey_RU ( v1 & v2 )

PHP DevConf KZ🇰🇿

Modern::Perl

pro.rb (Ruby/Rails / RU)

Software Design/Architect...

sql_ninja

AndroidDev Pro:: Професси...

WordPress for developers

PowerShellRus - о Powersh...

Haskell Start

Эльбрусы и с чем их едят

Python для анализа данных

Скрипты Гугл, Таблицы, Go...

WebGL ru

Compiler Development

firebase_ru — русскоговор...

Electron.js

phpclub.ru

RU.CRYPTOGRAPHY — Криптог...

pro.osdev - os developmen...

RU.Docker — Официальное Р...

Emacs — русскоговорящее с...

FreePascal & Lazarus

Язык программирования Jul...

WordPress – русскоговорящ...

Django

sentry_ru

ReasonML и OCaml

WebAssembly — русскоговор...

ansible — русскоговорящее...

Сrystal Lang — русскогово...

aiohttp

Clojure — русскоговорящее...

heroku_ru

PowerShell Pro

macOS Developers — русско...

DL in NLP discussion grou...

systemd

use Perl or die;

FORTH и родственные ЯП

Natural Language Processi...

ru_jenkins

CatBoost

CyberBiology

Sequelize - community (en...

sonarqube_ru

Elm Lang сообщество разра...

SublimeText_RU

NativeScript

WordPress CodeRun

ReactiveX - русскоговорящ...

PureScript — русскоговоря...

#Вайти

Эликсир и Вунш

Cassandra

Natural Language Processing

Anatoly Belov

Коллеги, всем привет ) есть аудиофайл на 2 канала разбивать по каналам

умеем (делаем обнуления поочередно). это ок.
транскрибировать каждую дорожку умеем. это ок.

вопрос:
знаете ли готовые решения/сети/библиотеки,
чтобы выдавать текст сразу с делением на паузы и таймингом?

#nlp #programming #russian

03.08.2023

6 ответов

52 просмотра

D F

whisper?

03.08.2023

Anatoly Belov Автор вопроса

D F
whisper?

увидел, спасибо )

03.08.2023

Anatoly Belov Автор вопроса

D F
whisper?

а где там разделение на паузы и тайминг? сходу в доках нет описания по этим пунктам

03.08.2023

D F

Anatoly Belov
а где там разделение на паузы и тайминг? сходу в д...

я не настоящий сварщик, но как минимум в тайминг оно умеет вроде https://github.com/openai/whisper/discussions/98

03.08.2023

David Dalé

Whisper хорошо транскрибирует, в том числе с таймингом (если брать не модель с HF, а из оригинального реоп OpenAI, где есть опция word_timestamps). Но в паузы он не умеет, кроме случаев, когда они разделяют "сегменты" (это понятие из лексикона Whisper, и там эти сегменты примерно совпадают с предложениями обычно). Если паузы нужны, можно по этому тьюториалу сделать force alignment букв с фреймами аудио любой CTC-based моделью (если нужна мультиязычная, можно взять MMS). https://pytorch.org/audio/stable/tutorials/forced_alignment_tutorial.html. И после такого выравнивания можно считать отрезок речи между первой и последней буквами в слове - речью, а остальное - паузой.

03.08.2023

Anatoly Belov Автор вопроса

David Dalé
Whisper хорошо транскрибирует, в том числе с тайми...

увидел, спасибо )

03.08.2023

Похожие вопросы

Natural Language Processing / Dmitriy

всем привет! 📗Есть задача генерации вопросов к тексту Посоветуйте что почитать ? Что использовать? дообучить, формат датасета

#nlp #programming #russian

06.09.2023

57 ответов

Natural Language Processing / Igor Chesnokov

Всем привет: после курса Andrew Ng Machine Learning Specialization играю с llama-2-7b-chat.ggmlv3.q8_0 и датасетом в форме текстов Сенеки. Ответы начинаются нормально, но под ...

#nlp #programming #russian

27.09.2023

10 ответов

Natural Language Processing / miteigi nemoto

Помогите интерпретировать результаты тестов. Почему большинство моделей имеют плохую релевантность? Даже те, что якобы на русский язык ориентированы. Сравнение разных моделей...

#nlp #programming #russian

06.08.2023

2 ответов

Natural Language Processing / datascience xc

Я пригласил девушку на свидание, мы договорились встретиться в 9. Я купил цветы и стал ждать ее, сидя на скамейке. Была прекрасная погода и у меня было хорошее настроение. В 1...

#nlp #programming #russian

15.09.2023

19 ответов

Natural Language Processing / vvv

Кейс с ChatGPT про 10.000 € в месяц 🤑 Интересно? Рассказываю. Есть компания, которая уже пару декад делает аналитику для торговых сетей. Они хороши в своем деле, что клиент...

#nlp #programming #russian

14.09.2023

5 ответов

Natural Language Processing / Serg Sk

Добрый день. Хочу взять RTX 4090. Или есть смысл заморачиваться и искать с жидкостным охлождением, когда модуль охлаждения отдельно. Может у кого есть какой-то полезный опыт в...

#nlp #programming #russian

16.11.2023

22 ответов

Natural Language Processing / Ростислав Корст

Всем привет! Подскажите, пожалуйста, для поиска использую e5 с векторами 1024 float32 Качество поиска фича similarity между запросом и документом супер растит, но соответстве...

#nlp #programming #russian

05.10.2023

21 ответов

Natural Language Processing / Владимир Кузовкин

коллеги,добрый вечер. У меня текст был разбит на несколько токенов. Все прекрасно, да вот беда: в нем очень часто идут повторения слов. Например первые три строки можно отнест...

#nlp #programming #russian

28.09.2023

23 ответов

Natural Language Processing / Oleg

Господа и дамы, ИИ эксперты, подскажите не знающему (кто чем сможет в любом виде: подходы, названия, ссылки, метрики) как получить ранжирующую модель, если есть пара тысяч отд...

#nlp #programming #russian

23.10.2023

2 ответов

Natural Language Processing / Nick

Привет! Кто знает, существует ли подобный этому leaderboard для русскоязычных embeddings?

#nlp #programming #russian

11.08.2023

27 ответов

Смотреть еще

Natural Language Processing