from transformers import AutoModelForCausalLM, AutoTokenizer model_id = "ai-forever/ruGPT-3.5-13B" tokenizer = AutoTokenizer.from_pretrained(model_id) model = AutoModelForCausalLM.from_pretrained(model_id, device_map="auto") request = "Пушкие родился в " encoded_input = tokenizer(request, return_tensors='pt', \ add_special_tokens=False).to('cuda:0') output = model.generate( **encoded_input, num_beams=2, do_sample=True, max_new_tokens=100 ) print(tokenizer.decode(output[0], skip_special_tokens=True))
Это я видел в статье на Хабре. Я имел в виду, как проинициализировать саму модель? Ну т.е. вот скачал я ее, что дальше делать (до того момента, как уже задать запрос)? Прошу прощения, если мой вопрос кажется глупым. Просто хочу найти ссылку на пример, чтобы можно было уже дальше разбираться с запуском конкретно у себя.
Ну все. Подсовываешь в model_id путь и запускаешь этот код
Если это так просто, то спасибо вам огромное за совет!
Да. Сейчас модель может запустить даже пятиклассник
Обсуждают сегодня