170 похожих чатов

Подскажите, пожалуйста, а у каких опенсорс LLM сейчас есть длинный

input в токенах? Запутался, какой сейчас максимальный контекст для llama2? В конфиге написано - max_position_embeddings=4096, это оно?

4 ответов

11 просмотров

Будем тестить сегодня вечером как раз

https://huggingface.co/Yukang

не могу найти где видел как кто-то тестировал LLM на то, как она с большим контекстом работает типа брал полуосмысленную фразу например: "смысл жизни -- стряпать блины" и вставлял ее >в самое начало >с 1к токенов >с n+1k токенов и задавал вопрос "в чем смысл жизни?" а потом считал, скок раз и в каких местах ошиблась\дала правильный ответ ____ кто-нибудь меня понял? лол можете ссылку кинуть? === есть желание эту лора также протестить (мб кто-то уже делал?) ======== про лост-ин-мидл быстро находит но вроде не совсем оно, более детально

Похожие вопросы

Обсуждают сегодня

Кстати, а я вот тут подумал. Допустим, у нас имеется цикл который выполняет огромное количество итераций, но мы хотим, чтобы какие-то действия исполнилось только один раз. В Я...
The Bird of Hermes
23
Доброй ночи. Вопрос знатокам. Имеется некая таблица, результат которой выведен в DBGrid на форме. И есть форма, с помощью которой можно как добавить запись, так и отредактиров...
Евгений
28
а всё почему? потому что ассемблер в отличии от яву порождает множество пагубных привычек, среди которых например можно отметить использование глобальных переменных для всего ...
Mixail Frolov
35
анрей С какой целью зашёл?
КТ315
42
я часов 15 назад начал пытаться написать хоть что-то напоминающее ос и у меня есть проблема, которую я пытаюсь решить последние часов 5: есть крч 2 исходника с минимальным код...
Al1to
17
Кто нибудь из участников чата пишет на ассемблере под GNU/Linux?
Spiker01
24
Всем привет ребят! Мб кто-то сталкивался? adminСomponents .get("searchСomponents", use: searchComponents) .openAPI( summary: ...
Admin Adminov
2
Насколько моя реализация Exercise 1 плохая? data MessageType = Info | Warning | Error Int deriving (Show, Eq) type TimeStamp = Int data LogMessage = LogMessage ...
= ?
10
Кстати вопрос. Проанализировав свои проекты я понял, что в наиболее ценных из них Асм использовался для организации real-time процессов (внутри DOS). А какие есть способы сего...
Alexander Morozov
18
Я не очень много работал с потоками, тут возник вопрос - если будет одновременный доступ к памяти из двух разных потоков, это само по себе приведет к ошибке?
The Bird of Hermes
25
Карта сайта