бы 5))
Нашел такое https://github.com/synxlin/nn-compression
Но вопрос, а какой метод подходит под какую архитектуру?
Можно дистилировать модель
Дистилляция, прунинг, квантизация.
Да, тут такая фишка, что модель до тюнинга была 6гб,после стала 17. Ясно, что качество её не выросло в 3 раза, оно осталось такое же. Так вот и уменьшить я хочу без потери качества
Обсуждают сегодня