pix2pix энкодера-декодера? Потому что unet с глубиной 8+8 слоев и каналами [64 128 256 512 512 512 512 512] весит непозволительно много (200+ MB). Кто-нибудь мобайлнет-подобные архитектуры для этих целей использовал?
Не знаю, применяют ли в картинках, но, может, квантизация?
Обсуждают сегодня