ли модель ученик должна быть такой же архитектуры, но уменьшенного размера или можно использовать любую? Хочу использовать дистилляцию знаний
Не понял, можешь переформулировать? Речь про бд?
Ну я хочу использовать дистилляцию, обязательно ли использовать меньшую модель той же архитектуры или это не важно ну я имею ввиду допустим если я использую resnet101 мне обязательно тренировать как ученика resnet 51 или я могу использовать Xception
А.. про нейронки) не шарю в том что ты описал Предполагаю, что не важно какой архитектуры, но это просто догадки
Обсуждают сегодня