обучения быстрее? Сейчас векторизую их с помощью rubert-tiny в классе датасета в getitem и по ощущениям это узкое место при обучение на большом числе данных. Даже не всю видеокарту использует
Если использует не всю видеокарту, возможно, стоит batch size увеличить (getitem, подозреваю, применяется к одному тексту за раз)
Обсуждают сегодня