Всем привет! Подскажите как можно ускорить inference в saiga_13b_llamacpp_retrieval_qa?
Всем привет! Наверное уже спрашивали, подкскажите пож-та, есть ли notebook или пример(tutorial) как зафайнтюнить Lora Adapter модель (например saigu) на своих данных?
Всем привет! Подскажите, пож-та, есть ли туториал как поднять такой space локально - RAG QA https://huggingface.co/spaces/IlyaGusev/saiga_13b_llamacpp_retrieval_qa?