Какой самый простой способ деплоя модели для инференса? Fastapi?

> fastapi > мной написанный сервер Ладно бы про tornado, он реально заставляет прямо сетевое приложение писать, а у fastapi многовато всего под капотом, чтобы говорить про свободную кастомизацию/оптимизацию. Вот во сколько процессов/потоков он будет работать? Сколько экземпляров модели будет загружено в память? Будут ли страдать асинхронные обработчики от запуска compute-intensive blocking обработчиков по соседству?

0

21.11.2023

Aleksandr

text generation inference

0

21.11.2023

Aleksandr

Andrew Grigorev
> fastapi > мной написанный сервер Ладно бы про t...

а кто будет очередь писать обрабатывать для модели? батчи кто собирать будет? суцкевер? 2023 на улице, сейчас свой сервер это сильно больше чем тупо /get /post

0

21.11.2023

Aleksandr

Rinat Abdullin
LLM моделей? FastAPI - если сделать попроще и поб...

text generation inference

0

21.11.2023

Andrew Grigorev

Aleksandr
а кто будет очередь писать обрабатывать для модели...

изначальный вопрос такого не подразумевал 😊 > Какой самый простой способ деплоя модели для инференса? Fastapi?

0

21.11.2023

Aleksandr

Andrew Grigorev
изначальный вопрос такого не подразумевал 😊 > Как...

если вас спросить на чем писать модель вы с++ предложите?

0

21.11.2023

Andrew Grigorev

Aleksandr
если вас спросить на чем писать модель вы с++ пред...

отвечу что вопрос задал какой-то некомпетентный чувак и на него не надо отвечать 😊 а вообще много хороших примеров что С++ для инференса это хорошо - llama.cpp, triton

0

21.11.2023

Aleksandr

Andrew Grigorev
отвечу что вопрос задал какой-то некомпетентный чу...

для этого и есть группы чтобы новички не собирали грабли лбом

0

21.11.2023

Andrew Grigorev

Aleksandr
для этого и есть группы чтобы новички не собирали ...

вот я и стараюсь чтобы в такой группе новичкам не советовали на fastapi инференс делать

0

21.11.2023

Aleksandr

Andrew Grigorev
вот я и стараюсь чтобы в такой группе новичкам не ...

вы буквально советуете tornado для моделей на торче, зачем?)

0

21.11.2023

Andrew Grigorev

Aleksandr
вы буквально советуете tornado для моделей на торч...

у вас есть связь с реальностью? где я такое советую?) я только говорю что "fastapi - свой сервер" это не верное утверждение, что оно может иметь место только для более низкоуровневого фреймворка

0

21.11.2023

Aleksandr

Andrew Grigorev
у вас есть связь с реальностью? где я такое совету...

буквально

0

21.11.2023

miteigi nemoto · Accepted Answer

miteigi nemoto

Он простой, но однопоточный, насколько понял. Не подходит для параллельных запросов от разных скриптов

0

20.11.2023

170 похожих чатов

Какой самый простой способ деплоя модели для инференса? Fastapi?

19 ответов

Похожие вопросы