Похожие чаты

Ребят, у кого есть опыт размещения моделей на инференс на

GPU - есть ли глобально разница на какой гпу размещать модель - на tesla t4, RTX 2080ti, NVIDIA Quadro если памяти нужно ну скажем 11гб на модель? Эти все видеокарты есть у облачных провайдеров, но какую лучше выбрать, может какая-то из них более эффективна на инференсе, а друга на обучении?

11 ответов

12 просмотров

Надо выбирать карту опираясь на ТЗ. Если совсем поверхностно, то: чем больше VRAM, те больше батч можно обрабатывать при обучении и инференсе; чем больше ядер куда и выше compute capability, то можно предположить, что тем и быстрее инференс. Но тут еще вопрос оптимизации модели под конкретное железо. Без понимания входных данных и требований по работе нельзя ответить какой карты тебе будет достаточно, какой не хватать, а какая будет с избытком.

Модель работает в mixed precision?

Vic- Автор вопроса
Pavel Shiriaev
Надо выбирать карту опираясь на ТЗ. Если совсем по...

уже протестили модель pytorch, она работает даже на 1080ti , на t4, tv100 - по ощущениям одинаково, то есть тут вопрос нагрузки, когда юзеров станет 100 что будет?

Vic
уже протестили модель pytorch, она работает даже н...

2080ti будет быстрее 1080ti если модель запустить в mixed precision

Лис Электронщик
2080ti будет быстрее 1080ti если модель запустить ...

она и без mixed precision скорей всего будет быстрее

Vic
уже протестили модель pytorch, она работает даже н...

сделать тест на работу при 100 параллельных пользователях

Лис Электронщик
не особо

https://lambdalabs.com/blog/2080-ti-deep-learning-benchmarks/ просто первую ссылку открыл, первый график

Бери где больше памяти, у меня был кейс когда не хватило памяти и на одном из бачей упало с сиггкилом

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
@Benzenoid can you tell me the easiest, and safest way to bu.y HEX now?
Živa Žena
20
This is a question from my wife who make a fortune with memes 😂😂 About the Migration and Tokens: 1. How will the old tokens be migrated to the new $LGCYX network? What is th...
🍿 °anton°
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
What is the Dex situation? Agora team started with the Pnetwork for their dex which helped them both with integration. It’s completed but as you can see from the Pnetwork ann...
Ben
1
Гайс, вопрос для разносторонее развитых: читаю стрим с юарта, нада выделять с него фреймы с определенной структурой, если ли чо готовое, или долбаться с ринг буффером? нада у...
Vitaly
9
Anyone knows where there are some instructions or discort about failed bridge transactions ?
Jochem
21
@lozuk how do I get my phex copies of my ehex from a atomic wallet, to move to my rabby?
Justfrontin 👀
11
Карта сайта