Никогда не задавался этим вопросом, но как увеличивают контекстное окно

Question

Natural Language Processing

Anton Ul

Никогда не задавался этим вопросом, но как увеличивают контекстное окно

у моделей ?

#nlp #programming #russian

0

03.08.2023

2 ответов

34 просмотра

vvv

Технически можно просто налепить обычных аттеншенов, но там проблема что сложность вычислений квадратично растёт, а железок не бесконечно Поэтому придумывают хаки Например bigbird Когда считает аттеншн не по всем для всех А по соседним, крайним и рандомным токенам

0

03.08.2023

Алим · Accepted Answer

Алим

Методов несколько от банального дообучения на бОльшем контексте до интрополяции эмбеддингов. Вот интересная статья по последнему способу + есть связанная статья от Меты https://kaiokendev.github.io/til#extending-context-to-8k

0

03.08.2023

170 похожих чатов

Никогда не задавался этим вопросом, но как увеличивают контекстное окно

2 ответов

Похожие вопросы