много читали?
и не только читать надо, но и проводить эксперименты
я слышал про адам, это один из вариантов градиента. типа момента. просто не интересовался подробностями (зачем столько сил на оптимизацию градиентного спуска? простые методы почти так же работвют на сложных задачах)
Обсуждают сегодня