считает ошибку на рандомном подмножестве трейна при каждой итерации? Вроде бы даже на 1 наблюдении?
в этом смысл sgd - считать ошибку на малом куске и апргейдить веса относительно этой ошибки
Обсуждают сегодня