Пока не приходилось делать такое. Для чего это делать?
Ну вроде как размер поменьше, работает быстрее. Нет?
В общей практике моделей - да, именно так.
а в частности?:)
Сейчас медленно работает? CPU/GPU?
не совсем так. я для английского языка когда сравнивал модель nemo, то onnx была быстрее заметно на cpu и намного меньше памяти использовала. вот хотел такое же попробовать для другого языка на wav2vec
Обсуждают сегодня