штука. Но я не хочу их глубоко копать - думаю конкретные их особенности к Data Science относятся слабо.
Ну, наверное, ожидали ответа в духе "для каждой операции в дереве вычислений заранее определяется способ взятия частных производных, после чего при помощи chain rule и других правил дифференцирования высисляется каждая нужная частная производная + работает кеширование значений, чтобы не вычислять повторно"
https://github.com/dubai-open-data-science/deep-learning-course/tree/master/lecture-1/lecture_full
В статье "pytorch - ваш новый фреймворк глубокого обучения" даже показывают, как создать простой класс на питоне, аналог Variable
Обсуждают сегодня