170 похожих чатов

Пробовали задеплоить модель bert-base-multilingual-cased (https://github.com/neulab/awesome-align) на Heroku, но ей для

работы надо 1,5 gb памяти. На Heroku это получается 250$ вмесяц. Как можно удешевить деплой? Можно ли логику оставить на Heroku, а самому модель положить на какой-нибудь дешевый data storage? В целом, какие бестпрактики в таких случаях?

2 ответов

1 просмотр

Нет, тут data storage не поможет, ведь вы хотите её не просто хранить, а использовать, а для этого модель всё равно придется загружать в оперативную память) Можно порекомендовать две вещи: 1) Использовать модель поменьше (какую именно - зависит от языка/языков, с которыми вы работаете, и конкретной решаемой задачи). 2) Попробовать экспортировать модель в ONNX и навесить на неё разных оптимизаций (фреймворк optimum вроде позволяет это довольно легко делать: https://huggingface.co/docs/optimum/v1.2.1/en/quickstart).

Alexander- Автор вопроса
David Dalé
Нет, тут data storage не поможет, ведь вы хотите е...

Благодарю за развернутые рекомендации! Подскажите, как формулируется название роли специалиста, которому такое лучше делегировать? Либо опыт с какими технологиями должен присутствовать?

Похожие вопросы

Обсуждают сегодня

А еще в перле можно уже @arr1 + @arr2?
Sergei Zhmylove
53
я не магистр хаскеля, но разве не может лейзи тип конвертнуться в не-лейзи запросив вычисление содержимого прям при инициализации?
deadgnom32 λ madao
100
Привет всем. появился вопрос. Разрабатываю сайт, в данный момент он запущен. Хостинг beget. Добавляю на сайт яндекс метрику с помощью полей client-settings (взято отсюда http...
Andrew
2
Подскажите, где смотреть результат выполнения программы? Код: ;.686 ;Система команд процессора 686 ;.MODEL FLAT,stdcall ;Модель памяти плоская, станда...
Егор Анелькин
5
Где в Астане можно купить мясо для шашлыков?
Dancing Іңұқәһүғө
21
Добрый день подскажите пожалуйста может кто то сталкивался с ошибками Sentry 22.10.0 развернутым из helm чарт в Kubernetes? Изначально 3 дня назад очень стало много событий ух...
Tire4 Finist Devops
1
;.686 ;Система команд процессора 686 ;.MODEL FLAT,stdcall ;Модель памяти плоская, стандартный ;вызов процедуры ;option casemap:no...
Егор Анелькин
1
почому оно не работает?
Vi Chapmann ٩( 💢•̀ з•́)و Chapmann
19
всем привет почти закончил курс После него можно писать свою операционку? Какие библиотеки надо использовать и куда дальше копать для изучения
Linus
19
Так а кто может спарсить всех участников чата? Идишники
Magic
18
Карта сайта