Подскажите пожалуйста, может я не совсем понимаю В чем разница, между двумя вариантами: * AutoGPTQForCausalLM.from_quantized("fffrrt/ruGPT-3.5-13B-GPTQ") и потом `GPTQLoraConf...
А кто-нибудь может подсказать пожалуйста, с чем связаны такие низкие значения top_k и temperature в стандартных конфигах сайги? Наверняка это какой-то конкретной особенностью ...
Кто-нибудь может пожалуйста подсказать, как выставить длину генерации при обучении в T5? Я использую Seq2SeqTrainer с DataCollatorForSeq2Seq (max_length в нем пробовал, не пом...
не совсем NLP-вопрос, но кто-нибудь знает, трекает ли wandb использование разными людьми одного аккаунта? не хочется лишние $60 платить за каждого нового участника
Ну, в идеале должен быть один формат А можно ссылку на пример?
есть скачать бесплатно без смс?