слоев енкодера и декодера в моделях распознавания речи (трансформер, конформеры и прочие rnn)?
Обычно выбирают методом тыка. Есть продвинутые алгоритмы вроде automl, байесовской оптимизации и генетических алгоритмов. Ими мало кто пользуется, потому что нужно много вычислений. В целом же надо тренировать насколько большую модель, насколько позволяют вычислительные ресурсы:
https://arxiv.org/pdf/2106.09488.pdf
> И когда необходимо добавлять слои к обученной модели, или это плохая практика?
смысла в этом большого нет
> Буду крайне признателен, если подскажете ресурс/источник по рекомендациям для обучения своих моделей (если такой есть), или как прийти к пониманию вопросов и ответов на них 🙏
Надо не рекомендации искать, а теорию изучать прежде всего
Спасибо!
Обсуждают сегодня