работают в сеттинге seq2seq?
б) какой у них типичный размер словаря?
1) Seqvec: https://pypi.org/project/seqvec/ bio_embeddings (many models in one package): https://github.com/sacdallago/bio_embeddings
о prot_t5 выглядит как то чо нужно
prot_T5: https://www.kaggle.com/code/horikitasaku/linernet-for-protein-pytorch-prott5-embeddings
Обсуждают сегодня