для оценки генерируемого глоса без бюджета на MOS?
MOSNet: Deep Learning based Objective Assessment for Voice Conversion https://arxiv.org/abs/1904.08352
Коллег заставить слушать :)
Обсуждают сегодня