967 чатов

Комьюнити Binance

React — русскоговорящее с...

Android Developers

Python

Vue.js — русскоговорящее ...

Node.js — русскоговорящее...

DevOps — русскоговорящее ...

JavaScript Noobs — сообще...

Django [ru]

Go-go!

Angular - русскоговорящее...

ntwrk

Верстка сайтов HTML/CSS/J...

phpGeeks

Где взять займ?

Kubernetes — русскоговоря...

Смотреть еще

miteigi nemoto

Username @miteigi

Телефон —

Как скрыть?

Измените конфиденциальность Username и Телефона в настройках Telegram на «Только контакты» или «Никому» и через некоторое время они исчезнут с сайта

112 просмотров

36 вопросов от miteigi

Natural Language Processing / miteigi nemoto

Помогите интерпретировать результаты тестов. Почему большинство моделей имеют плохую релевантность? Даже те, что якобы на русский язык ориентированы. Сравнение разных моделей...

#nlp #programming #russian

06.08.2023

2 ответов

Natural Language Processing / miteigi nemoto

LLAMA2 7b finetuning на малом текстовом блоке при разных batch_size Иходный блок датасета начинается с LLaMA (Large Language Model Meta AI) is a family of large language mod...

#nlp #programming #russian

09.08.2023

5 ответов

Natural Language Processing / miteigi nemoto

"ai-forever/sbert_large_mt_nlu_ru" - плохая релевантность 1024 размер вектора е Солнечной системы он поставил Солнце, а планет score: 0.49211593419714794 ру, переходят все на...

#nlp #programming #russian

06.08.2023

1 ответов

Natural Language Processing / miteigi nemoto

Использую llama-2 для Q&A Когда в документе нет искомого он пишет (фантазирует) python3 main.py "What doing Karl Schwarzschild?" Answer: Karl Schwarzschild is a researcher at...

#nlp #programming #russian

27.07.2023

7 ответов

Natural Language Processing / miteigi nemoto

А оптимизаторы на качество влияют или только на длительность обучения и ресурсы? Stores the acceptable string identifiers for optimizers. ADAMW_HF = "adamw_hf" ADAMW_TORCH =...

#nlp #programming #russian

09.08.2023

3 ответов

Natural Language Processing / miteigi nemoto

Кто-нибудь осилит под заказ сделать скрипт?

#nlp #programming #russian

25.07.2023

9 ответов

Natural Language Processing / miteigi nemoto

По сути сейчас небольшому стартапу масштабировать llama инференс весьма затратная тема. Даже такие модели Mistral 7b не сильно меняют ситуацию. А подскажите, какие подходы е...

#nlp #programming #russian

09.11.2023

4 ответов

Natural Language Processing / miteigi nemoto

А куда именно вписать?

#nlp #programming #russian

27.07.2023

7 ответов

Natural Language Processing / miteigi nemoto

А есть ли разница в качестве, когда загружаешь модель fp32 в 8бит, или модель которая уже в 8бит лежит в исходнике?

#nlp #programming #russian

05.10.2023

5 ответов

Natural Language Processing / miteigi nemoto

@YallenGusev Спасибо за ответы. Много времени на эмпирику экономите. Есть ли способ заставить модель при тюнинге забыть все, что она знала до этого и отвечать только по предос...

#nlp #programming #russian

09.08.2023

5 ответов

Natural Language Processing / miteigi nemoto

Модель LLAMA-2. Как понять, какой объем текста можно указывать в контексте (в промте), чтобы по нему задавать вопросы?

#nlp #programming #russian

03.08.2023

5 ответов

Natural Language Processing / miteigi nemoto

При SFTTrainer трейне LLAMA, размещенной на двух gpu сначала грузится одна GPU, потом другая и так весь трейн. Это нормальное поведение или что-то надо допилить в конфиге?

#nlp #programming #russian

09.08.2023

4 ответов

Natural Language Processing / miteigi nemoto

А какой промт использовали?

#nlp #programming #russian

05.09.2023

4 ответов

Natural Language Processing / miteigi nemoto

как оценить, что у текста математики от астрономии должен быть 0.777 и тогда будет точно что далеко?

#nlp #programming #russian

14.09.2023

3 ответов

Natural Language Processing / miteigi nemoto

ну вообще не очевидные вещи, так-то. и по каждой новой модели надо гуглить эту формулу?

#nlp #programming #russian

14.09.2023

3 ответов

Natural Language Processing / miteigi nemoto

А почему при инференсе llm не используются tensor cores?

#nlp #programming #russian

05.10.2023

3 ответов

Natural Language Processing / miteigi nemoto

Есть смысл гнаться за этими 80гб на борту? Если можно 4 3090х воткнуть минимум и дешевле в несколько раз будет, чем а100.

#nlp #programming #russian

05.10.2023

2 ответов

Natural Language Processing / miteigi nemoto

это значит модель вообще почти не различает текст?

#nlp #programming #russian

06.08.2023

3 ответов

Natural Language Processing / miteigi nemoto

Можно еще рассмотреть https://selectel.ru/services/gpu/?section=dedicated У Яндекса есть. но это дичь запутанная для серьезной игры в ИТ-инфраструктуру https://cloud.yandex....

#nlp #programming #russian

04.10.2023

1 ответов

Natural Language Processing / miteigi nemoto

блин.. в чем тогда смысл фукнции симилярити если нужно ручками еще пороги искать?

#nlp #programming #russian

14.09.2023

2 ответов