обучения быстрее? Сейчас векторизую их в классе датасета в getitem и по ощущениям это узкое место при обучение на большом числе данных
смотря каким способом энкодишь
Да в целом обычно, просто оно как будто не очень параллелится во время обучения
ну разве что для каждого слова составлять токены)
Обсуждают сегодня