помощью AWS Lambda?
более конкретный вопрос спросить можешь) не уверен что совсем по адресу чат, но +- подходит
Мы поддерживаем выкатку под скоринг в серверлесс (по сути в любой FaaS, в т.ч. Lambda), какие у вас вопросы?
больше было интересно про нюансы с деплоем в AWS (например через лямбду) сможет ли она прогонять картинки через сегментационную модель и возвращать маски (тоже картинки) какие +- по сравнению с сейджмейкером и тд
можно любую модель использовать, если она в рамки ограничений лямбды поместится, у AWS был пример даже какого-то инференса в блоге как любой подобный сервис, чем у вас выше загрузка тем менее выгоден серверлесс; дальше вы берете какой-то контейнеризованный сервис с резервом компьюта (fargate например), тут вы платите за компьют всегда, даже если трафика нет Sagemaker сервисы по-моему это специальные контейнеры с обвязкой, что-то вроде того же fargate (если не он же)
Спасибо большое за информацию!
Надо посмотреть особенности/ограничения AWS lambda, главные проблемы : - cold start - execution time - billing - local development В случае ML это будет крайне затратно часто загружать можешь в память при старте Посмотрите на sagemaker , очень просто делать деплои, стоимость сопоставима с арендой ec2 инстанса Функционально это кажется unicorn web server с апи который сделать inference скриптом что вы указали Будет свой регистр моделей, тоже удобно
Обсуждают сегодня