170 похожих чатов

React — русскоговорящее с...

Android Developers

Vue.js — русскоговорящее ...

Telegram Developers

Node.js — русскоговорящее...

DevOps — русскоговорящее ...

JavaScript Noobs — сообще...

Angular - русскоговорящее...

Верстка сайтов HTML/CSS/J...

Kubernetes — русскоговоря...

Битрикс для разработчиков

MODX. Русскоязычное сообщ...

pgsql – PostgreSQL

iOS Developers — русского...

ClickHouse не тормозит

Rust — русскоговорящее со...

JavaScript — русскоговоря...

React Native — русскогово...

Docker — русскоговорящее ...

HTML/CSS — русскоговоряще...

Python beginners

🐧 RU.UBUNTU — Официальное...

Kotlin Community

Чат экстремального погром...

Scala User Group

Клуб Vue.js-разработчиков

Xamarin Developers (MAUI,...

Svelte [svelt] - All abou...

Системное администрирован...

Nuxt.js | Vue SSR

var chat = new Chat();

Data Science Chat

Ассемблер

Android Architecture

Laravel для начинающих

Церковь метрик

QA — русскоговорящее сооб...

R (язык программирования)

Big Data Science :: AI / ...

Delphi & Lazarus

Solidity Development

Evolution CMS официальное...

pro.net (former COM+)

OpenStreetMap RU

Visual Studio Code — русс...

GraphQL — русскоговорящее...

IDE и редакторы — русског...

OpenCartForum - 🇺🇦🇪🇺Чат O...

Angular.js (1.x) — русско...

Flutter Developers — русс...

AI / Искусственный Интелл...

Laravel Framework Russian...

Чат — Верстка Сайтов и Фр...

Java Underground

Natural Language Processi...

SqlCom.ru - сообщество MS...

Delphi Community

Server Side Swift Develop...

Autohotkey_RU ( v1 & v2 )

PHP DevConf KZ🇰🇿

pro.rb (Ruby/Rails / RU)

Odoo talks & fun

Software Design/Architect...

AndroidDev Pro:: Професси...

WordPress for developers

PowerShellRus - о Powersh...

Эльбрусы и с чем их едят

Java/Kotlin and more

pro.buildsystems

Python для анализа данных

Скрипты Гугл, Таблицы, Go...

Compiler Development

firebase_ru — русскоговор...

RU.CRYPTOGRAPHY — Криптог...

pro.osdev - os developmen...

GameDev for Web

PostgreSQL (English)

Tilda Developers

RU.Docker — Официальное Р...

Emacs — русскоговорящее с...

FreePascal & Lazarus

Язык программирования Jul...

WordPress – русскоговорящ...

ReasonML и OCaml

WebAssembly — русскоговор...

ansible — русскоговорящее...

Сrystal Lang — русскогово...

Clojure — русскоговорящее...

macOS Developers — русско...

DL in NLP discussion grou...

use Perl or die;

FORTH и родственные ЯП

Natural Language Processi...

Sequelize - community (en...

Elm Lang сообщество разра...

WordPress CodeRun

ReactiveX - русскоговорящ...

PureScript — русскоговоря...

Эликсир и Вунш

Natural Language Processing

Konstantin Galagan

Коллеги, ай нид хэлп! Запустил инфиренс Сайги-2 70b, код запуска

со страницы модели HF с небольшими правками. Но! Оно ооооочень медленное. Что бы получить элементарный ответ пол часа уходит (не фигура речи).
Код запуска:
config = PeftConfig.from_pretrained(MODEL_NAME)

quantization_config = BitsAndBytesConfig(llm_int8_enable_fp32_cpu_offload=True)

model = AutoModelForCausalLM.from_pretrained(
config.base_model_name_or_path,
load_in_8bit=True,
torch_dtype=torch.float16,
device_map="auto",
quantization_config=quantization_config

)
model = PeftModel.from_pretrained(
model,
MODEL_NAME,
torch_dtype=torch.float16
)
Загрузка ГПУ на скрине
Чего ему не хватает?

#nlp #programming #russian

0

03.11.2023

11 ответов

67 просмотров

CPU написано забито на 100%

0

03.11.2023

Konstantin Galagan Автор вопроса

Alexander
CPU написано забито на 100%

Оно стабильно жрет одно ядро 31 оствльные курят

0

03.11.2023

Pavel Borisovich

Странно я ее на 12400 крутил в 4 битной квантизации. Она выдавала 1-2токена в секунду.

0

03.11.2023

llm_int8_enable_fp32_cpu_offload=True? а зачем?

0

03.11.2023

Konstantin Galagan Автор вопроса

Ilya Gusev
llm_int8_enable_fp32_cpu_offload=True? а зачем?

без этого не хотело взлетать с параметром load_in_8bit=True. Без параметра взлетело Но тоже тормозааааа

0

03.11.2023

Konstantin Galagan
без этого не хотело взлетать с параметром load_in_...

а почему без него не запускалось?

0

03.11.2023

Konstantin Galagan Автор вопроса

Ilya Gusev
а почему без него не запускалось?

тогда надо вырубать load_in_8bit=True

0

03.11.2023

Konstantin Galagan
тогда надо вырубать load_in_8bit=True

тогда модель в память не поместится

0

03.11.2023

Konstantin Galagan Автор вопроса

Ilya Gusev
тогда модель в память не поместится

80 Гб мало?

0

03.11.2023

Konstantin Galagan
80 Гб мало?

в 16 битах - естественно

0

03.11.2023

Konstantin Galagan Автор вопроса

Ilya Gusev
в 16 битах - естественно

Модель загрузилась

0

03.11.2023

Похожие вопросы

Natural Language Processing / Dmitriy

Подписаться

всем привет! 📗Есть задача генерации вопросов к тексту Посоветуйте что почитать ? Что использовать? дообучить, формат датасета

#nlp #programming #russian

06.09.2023

0

57 ответов

Natural Language Processing / Igor Chesnokov

Подписаться

Всем привет: после курса Andrew Ng Machine Learning Specialization играю с llama-2-7b-chat.ggmlv3.q8_0 и датасетом в форме текстов Сенеки. Ответы начинаются нормально, но под ...

#nlp #programming #russian

27.09.2023

0

10 ответов

Natural Language Processing / miteigi nemoto

Подписаться

Помогите интерпретировать результаты тестов. Почему большинство моделей имеют плохую релевантность? Даже те, что якобы на русский язык ориентированы. Сравнение разных моделей...

#nlp #programming #russian

06.08.2023

0

2 ответов

Natural Language Processing / datascience xc

Подписаться

Я пригласил девушку на свидание, мы договорились встретиться в 9. Я купил цветы и стал ждать ее, сидя на скамейке. Была прекрасная погода и у меня было хорошее настроение. В 1...

#nlp #programming #russian

15.09.2023

0

19 ответов

Natural Language Processing / vvv

Подписаться

Кейс с ChatGPT про 10.000 € в месяц 🤑 Интересно? Рассказываю. Есть компания, которая уже пару декад делает аналитику для торговых сетей. Они хороши в своем деле, что клиент...

#nlp #programming #russian

14.09.2023

0

5 ответов

Natural Language Processing / Serg Sk

Подписаться

Добрый день. Хочу взять RTX 4090. Или есть смысл заморачиваться и искать с жидкостным охлождением, когда модуль охлаждения отдельно. Может у кого есть какой-то полезный опыт в...

#nlp #programming #russian

16.11.2023

0

22 ответов

Natural Language Processing / Ростислав Корст

Подписаться

Всем привет! Подскажите, пожалуйста, для поиска использую e5 с векторами 1024 float32 Качество поиска фича similarity между запросом и документом супер растит, но соответстве...

#nlp #programming #russian

05.10.2023

0

21 ответов

Natural Language Processing / Владимир Кузовкин

Подписаться

коллеги,добрый вечер. У меня текст был разбит на несколько токенов. Все прекрасно, да вот беда: в нем очень часто идут повторения слов. Например первые три строки можно отнест...

#nlp #programming #russian

28.09.2023

0

23 ответов

Natural Language Processing / Oleg

Подписаться

Господа и дамы, ИИ эксперты, подскажите не знающему (кто чем сможет в любом виде: подходы, названия, ссылки, метрики) как получить ранжирующую модель, если есть пара тысяч отд...

#nlp #programming #russian

23.10.2023

0

2 ответов

Natural Language Processing / Nick

Подписаться

Привет! Кто знает, существует ли подобный этому leaderboard для русскоязычных embeddings?

#nlp #programming #russian

11.08.2023

0

27 ответов

Смотреть еще

Natural Language Processing

Подписаться

Вопросов 1570

Ответов 5203

Участников 5348

Telegram @natural_language_processing

Обсуждают сегодня

Господа, а что сейчас вообще с рынком труда на делфи происходит? Какова ситуация?

Rꙮman Yankꙮvsky

А вообще, что может смущать в самой Julia - бы сказал, что нет единого стандартного подхода по многим моментам, поэтому многое выглядит как "хаки" и произвол. Короче говоря, с...

30500 за редактор? )

Владимир

а через ESC-код ?

Чёт не понял, я ж правильной функцией воспользовался чтобы вывести отладочную информацию? но что-то она не ловится

У меня есть функция где происходит это: write_bit(buffer, 1); write_bit(buffer, 0); write_bit(buffer, 1); write_bit(buffer, 1); write_bit(buffer, 1); w...

Добрый день! Скажите пожалуйста, а какие программы вы бы рекомендовали написать для того, чтобы научиться управлять памятью? Можно написать динамический массив, можно связный ...

Недавно Google Project Zero нашёл багу в SQLite с помощью LLM, о чём достаточно было шумно в определённых интернетах, которые сопровождались рассказами, что скоро всех "ибешни...

Ребят в СИ можно реализовать ООП?

https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_h_common.erl#L174 https://github.com/erlang/otp/blob/OTP-27.1/lib/kernel/src/logger_olp.erl#L76 15 лет назад...

Карта сайта