<- тормоза тут
ans = outputs.numpy()
добавление после to('cpu') строчки torch.cuda.synchronize() не помогает
какой размер ответов-то?
строчка должна быть до
А в гайдах пишут, что после. Если до - вообще ничего не меняется
а вот ты сделай до, а потом померяй время от синхронизации до получения тензора в нампае
s2 = time() torch.cuda.synchronize() outputs = outputs.to('cpu') step2 += time() - s2 s3 = time() ans = outputs.numpy() step3 += time() - s3 так?
Обсуждают сегодня