Можно ли как-то по параметрам типа max_position_embedding у llm определить

Question

Можно ли как-то по параметрам типа max_position_embedding у llm определить

макс размер входного и выходного контекста? Или у локальных моделей он всегда суммарный input+output? Потому что у gpt4 turbo, который с контекстом 128k токенов, размер output только 4к.

#nlp #programming #russian

0

09.11.2023

3 ответов

33 просмотра

Ilya Gusev

Валентин Бубликов
А у LLM разве вообще выделяют входной и выходной к...

и да, и нет просто активации для входа можно параллельно считать а для выхода - нельзя то есть сгенерировать 10 выходных токенов при условии 1000 входных токенов стоит раз в 100 дешевле, чем 1000 выходных токенов при условии 10 входных токенов

0

09.11.2023

Валентин Бубликов

Ilya Gusev
и да, и нет просто активации для входа можно парал...

В целом правда. Что-то такое я и имел ввиду в "удешевлённая модель будет выдавать более короткие ответы, т.к. их дешевле генерировать".

0

09.11.2023

Валентин Бубликов · Accepted Answer

Валентин Бубликов

А у LLM разве вообще выделяют входной и выходной контекст?

0

09.11.2023

170 похожих чатов

Можно ли как-то по параметрам типа max_position_embedding у llm определить

3 ответов

Похожие вопросы