я думаю что это делается на сервере заранее. я такое реализовывал при записи голосовых сообщений. записывается массив пиков waveform и потом уже с ним работать
вообще-то полно туториалов есть как это сделать с canvas и webaudio API
Обсуждают сегодня