Приветы. Кто-нибудь использовал энкодер от T5 (LongT5) вместо условного BERTа

Question

как енкодер текста? Если да, то как файнтюнили/насколько разнились метрики?

#nlp #programming #russian

0

09.07.2022

54 просмотра

И есть еще вот такая имплементация его https://github.com/monologg/EncT5

0

10.07.2022

А, там декодинг через кросс атеншн

0

10.07.2022

Я может не туда смотрю, но в этой имплементации просто накинули линейный слой поверх энкодера.

0

10.07.2022

Увы, имплементация неофициальная

0

10.07.2022

Ilya Nikitin · Accepted Answer

Такой подход описан в гугловской статье EncT5 https://arxiv.org/pdf/2110.08426.pdf

0

09.07.2022