170 похожих чатов

Всем привет! Подскажите как мне скачать целиком модель с hugging face? Я

пробую так:
git clone https://huggingface.co/facebook/wmt19-ru-en

Но он качает только словари, токены и конфиг, а когда я инициализирую модель у себя через:
tokenizer = FSMTTokenizer.from_pretrained("./facebook/wmt19-en-ru")
model = FSMTForConditionalGeneration.from_pretrained("./facebook/wmt19-en-ru")

Начинает качать саму модель ~1гб
На сколько я понимаю используется эта модель:
https://github.com/pytorch/fairseq/blob/main/examples/wmt19/README.md

Собственно как мне её скачать и положить у себя локально, чтобы каждый раз при инциализации не качалось из интернета?

5 ответов

203 просмотра

Я не эксперт, но когда ты запускаешь from_pretrained, то по сути и просишь скачать модель. А если у тебя есть модель уже с весами, то можно же её torch.load сделать

Я просто в коде скачивал модель, а потом сохранял её, получалась директория, которую передаёшь как параметр в from pretrained.

Vova-Semerikov Автор вопроса
Max Ermakov
Я просто в коде скачивал модель, а потом сохранял ...

Точно, это долго сработать. сейчас попробую, спасибо!)

Max Ermakov
Я просто в коде скачивал модель, а потом сохранял ...

Я также делаю, передаю просто папку репозитория, и он под капотом все сам инициализирует. Для того, чтобы скачать всю модель в репозиторий, надо до клонирования репо выполнить «git lfs install”. Тогда все модели тоже скачаются. Это вообще прямо на сайте в окошке use in transformers описано, кажется

Похожие вопросы

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?
Rꙮman Yankꙮvsky
29
А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...
Viktor G.
2
30500 за редактор? )
Владимир
47
а через ESC-код ?
Alexey Kulakov
29
Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится
notme
18
У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...
~
14
Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...
Филипп
7
Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...
Alex Sherbakov
5
Ребят в СИ можно реализовать ООП?
Николай
33
https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...
Maksim Lapshin
20
Карта сайта