967 чатов

Комьюнити Binance

React — русскоговорящее с...

Android Developers

Python

Vue.js — русскоговорящее ...

Node.js — русскоговорящее...

DevOps — русскоговорящее ...

JavaScript Noobs — сообще...

Django [ru]

Go-go!

Angular - русскоговорящее...

ntwrk

Верстка сайтов HTML/CSS/J...

phpGeeks

Где взять займ?

Kubernetes — русскоговоря...

Смотреть еще

Alexander 🎤👑 Diesel

Username @icecreamflavors

Телефон —

Как скрыть?

Измените конфиденциальность Username и Телефона в настройках Telegram на «Только контакты» или «Никому» и через некоторое время они исчезнут с сайта

49 просмотров

14 вопросов от icecreamflavors

Natural Language Processing / Alexander 🎤👑 Diesel

Какой промпт стоит использовать, чтобы модель выдавала более длинный, подробный ответ на заданный вопрос? Пробовал: Answer must be X words in length Answer must be complex An...

#nlp #programming #russian

29.07.2023

14 ответов

Natural Language Processing / Alexander 🎤👑 Diesel

Всем привет, я запутался тут с LoRA, никогда ей раньше не пользовался. Я хочу подключить её к модели, чтобы там добавились эти дополнительные матрицы для обучения. Но при этом...

#nlp #programming #russian

02.10.2023

7 ответов

Natural Language Processing / Alexander 🎤👑 Diesel

Всем привет, подскажите, пожалуйста, насчёт тюнинга сайги на свою задачу. Верно ли, что я должен вначале скачать лламу, смерджить веса адаптеров, сохранить модель, а потом тол...

#nlp #programming #russian

10.11.2023

5 ответов

Natural Language Processing / Alexander 🎤👑 Diesel

Подскажите, а как делать суммаризацию с помощью LLM, если в неё не влезает весь текст?

#nlp #programming #russian

16.11.2023

7 ответов

Natural Language Processing / Alexander 🎤👑 Diesel

Подскажите, пожалуйста, а у каких опенсорс LLM сейчас есть длинный input в токенах? Запутался, какой сейчас максимальный контекст для llama2? В конфиге написано - max_position...

#nlp #programming #russian

17.11.2023

4 ответов

Natural Language Processing / Alexander 🎤👑 Diesel

Нужно ли делать padding текстов для дообучения LLM моделей (на основе llama)? В токенайзере нет pad токена. И не очень ясно, нужен ли padding, если там есть eos_token. И если ...

#nlp #programming #russian

21.11.2023

3 ответов

Natural Language Processing / Alexander 🎤👑 Diesel

Я верно понимаю, что в hf (huggingface.co/docs/transformers/tasks/multiple_choice) при файнтюнинге модели на multiple choice - модель по факту обучается на бинарную классифик...

#nlp #programming #russian

08.09.2023

1 ответов

Natural Language Processing / Alexander 🎤👑 Diesel

Всем привет, кто-то знает, сколько весит в ГБ llama2 70B? И можно ли её как-то запустить будет на одной А100?

#nlp #programming #russian

19.07.2023

5 ответов

Natural Language Processing / Alexander 🎤👑 Diesel

Так я не понял в итоге. Если я хочу тюнить ламы всякие, к которым прикрепил адаптеры русские. Мне надо слить их и обучать новые адаптеры? Или можно сразу дообучать эти же адап...

#nlp #programming #russian

10.11.2023

3 ответов

Natural Language Processing / Alexander 🎤👑 Diesel

Что происходит про изменении параметра max_sequence_length в моделях (Bert, Deberta) из huggingface? Берт максимум принимает 512 токенов, сохраняются ли pretrained веса при ум...

#nlp #programming #russian

03.09.2023

1 ответов

Natural Language Processing / Alexander 🎤👑 Diesel

То есть для русского будет лучше иностранная модель типо openorca, openchat?

#nlp #programming #russian

10.11.2023

3 ответов

Natural Language Processing / Alexander 🎤👑 Diesel

https://huggingface.co/Open-Orca/Mistral-7B-OpenOrca/blob/main/config.json А насчёт мистраля - "max_position_embeddings": 32768 -> у него такая длина, значит? Там просто ест...

#nlp #programming #russian

17.11.2023

1 ответов

Natural Language Processing / Alexander 🎤👑 Diesel

Хотел использовать llama2 для генераций ответов на вопрос, то есть мне не нужен диалог с ней. Но наткнулся на такую таблицу. Верно ли из этого, что 70B-chat может сработать лу...

#nlp #programming #russian

26.07.2023

1 ответов

Natural Language Processing / Alexander 🎤👑 Diesel

И каждый блок тюнить на таргет саммари?

#nlp #programming #russian

16.11.2023

1 ответов