У вас наблюдалось ускорение от формата TensorFloat32? (не путать с TensorFlow!) Я не вижу разницы между форматами, использую PyTorch.
Так он дефолтный
М, тогда почему переключение флагов torch.backends.cuda.matmul.allow_tf32 = False torch.backends.cudnn.allow_tf32 = False не изменяет время работы свёртки?
Хз, вообще у меня на 3090 тоже разницы особо не было
Обсуждают сегодня