Всем добрый день! Замеряем время обработки часового аудиофайла с речью

сервером websocket-gpu-batch воска на русской 0.42 модели на двух разных конфигах железа и получаем странные результаты:
1. AMD EPYC 7742 + NVIDIA A100-SXM4-40GB: 04:43 mins
2. Intel Core i9 13900k + NVIDIA RTX 4060 Ti 8G: 03.57 mins
Почему-то консьюмерская 4060 ti обгоняет обычно сильно более мощную в задачах ИИ A100. Не подскажет ли кто, из за чего может возникать такое странное расхождение? Или может быть у воска или у калди необходимо включить какие-то доп оптимизации для ускорения на серверных картах? В обоих случаях сервер работает в докер контейнере, единственное отличие в том что в случае 4060 TI использовали Windows и WSL2 для прокидывания карты, а в случае A100 обычный линукс и nvidia-docker

6 ответов

11 просмотров

а вы уверены что 4060ti настолько уж слабее a100? смотрите Peak Single Precision (FP32) Performance

Eugene- Автор вопроса
Sergey Bratchikov
screenshot а вы уверены что 4060ti настолько уж слабее a100? ...

Хм, не смотрел на этот показатель, а воск в f32 считается?

да. Вообще gpu для параллельной обработки файлов, на одном файле бесполезно смотреть

Eugene- Автор вопроса
Nikolay V. Shmyrev
да. Вообще gpu для параллельной обработки файлов, ...

Согласен, просто рассматриваем в том числе случаи когда цельные аудиозаписи такой длины тоже нужно обрабатывать, но в таком случае наверное разумнее делить их через какой-нибудь VAD и отправлять несколько фрагментов. Спасибо всем за помощь!

Eugene
Согласен, просто рассматриваем в том числе случаи ...

просто надо 100 таких файлов отправлять за раз, а не по одному

Sergey Bratchikov
screenshot а вы уверены что 4060ti настолько уж слабее a100? ...

Что за сайт, показывает такое сравнение?

Похожие вопросы

Обсуждают сегодня

Гайс, вопрос для разносторонее развитых: читаю стрим с юарта, нада выделять с него фреймы с определенной структурой, если ли чо готовое, или долбаться с ринг буффером? нада у...
Vitaly
9
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
длина пакета фиксированная, или меняется?
Okhsunrog
7
Вот еще странный косяк, подскажите как бороться. Я git clone сделал себе всего embassy и примеры там запускаю. Всё хорошо. Но вот решил в cargo.toml зависимости не как в приме...
Lukutin R2AJP
5
А в каком формате фреймы? Сам формат сейчас придумываешь, или что-то готовое нужно распарсить?
Okhsunrog
5
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Добрый вечер, Пока не совсем понимаю как наладить общение между телеграм ботом и ПО для работы с сим боксом. По самому боту так понял: - Нужен некий баланс, который можно поп...
Magic
6
Всем привет, нужна как никогда, нужна помощь с IO в загрузчике. Пишу в code16 после установки сегментных регистров, пишу вывод символа. Пробовал 2 варианта: # 1 mov $0x0E, %a...
Shadow Akira
14
Раз начали говорить про embassy, то присоединюсь со своими парой вопросов. 1) Есть ли сопоставимые аналоги для асинхронного кода в emdebbed? 2) Можно ли внутри задач embassy ...
NI_isx
6
сделал сайт, прикрутил в боте сайт, и виджет логина. как автоматически логинить пользователя в аккаунт(телеграм), при входе с бота?
Александра Чернивецкая
5
Карта сайта