есть самплы где спикер меняет голос что бы озвучить другого,то есть спикер тот же но он не много коверкает голос,есть идеи как это можно решить? (помню был тут вопрос но найти не смог)
вроде через F0 можно отфильтровать. У самого была такая задача, тогда вроде так рекомендовали
посчитать спикер эмбеддинги для каждого семпла и выкинуть выбросы)
было бы так просто,но в самле может быть и тот и тот голос
да, основная частота голоса
https://sail.usc.edu/~lgoldste/General_Phonetics/Tone/Measurement/measurement.html
Обсуждают сегодня