Может кто пояснить роль скипконекшн-блока для сглаживания гиперповерхности значения функции

Question

Big Data Science :: AI / Big Data / Machine Learning / MLOps

Может кто пояснить роль скипконекшн-блока для сглаживания гиперповерхности значения функции

ошибки пространства параметров модели?
Услышал это здесь (ссылка с тайм-кодом) https://youtu.be/egvX1wGCKSg?t=2044 , но автор только упомянает про это. Хотелось бы развёрнутое разъяснение

#database #programming #russian #software

0

14.05.2022

3 ответов

33 просмотра

Манкурт Кобейн Автор вопроса

Pavel Chernov
Скипконнекшн сглаживает функцию ошибки в пространс...

Так а что нам это "сглаживание" даёт? Типа, запоминание информации, как в рекурентных сетях?

0

14.05.2022

Pavel Chernov

Манкурт Кобейн
Так а что нам это "сглаживание" даёт? Типа, запоми...

Нет. Градиентные методы обучения двигаются по поверхности ошибки, стараясь найти глобальный (или оптимальный) минимум. Если поверхность "шершавая" - труднее понять, куда двигаться. А если поверхность гладкая - проще понять, куда двигаться. То есть - обучение происходит быстрее. Помимо поверхности, скипконнекшены помогают решить проблемы gradient exploding / vanishing. Да и градиенты распространяются лучше во время backpropagation через скипконнекшены.

0

14.05.2022

Pavel Chernov · Accepted Answer

Скипконнекшн сглаживает функцию ошибки в пространстве параметров, потому что в начале обучения модель ведёт себя так, как будто у нее меньше слоев. Как будто она проще. Уже потом, по ходу обучения, она усложняется, чтобы уловить более сложные зависимости. Это кратко.

215 похожих чатов

Может кто пояснить роль скипконекшн-блока для сглаживания гиперповерхности значения функции

3 ответов

Похожие вопросы