знания имеется в виду?
Ну для примера: все же знают, что Random forest лучше чем bagging(bootstrap aggregating).
Многие знают, это происходит потому что используется рандомное количество предикторов для постройки каждого дерева в случайных лесах. (обычно количество предикторов равна корню количества начальных предикторов)
Многие знают, это просто как факт.
Если глубже, он эффективнее, потому что он декореллирует деревья.
Если ещё глубже, это декорелляция, уменьшает variance конечной модели.
Если ещё дальше, то почему variance уменьшается, какая математическая формулировка?
Там достаточно большая формула, не буду в пример приводить.
прежде всего дать себе четкие определения дисперсии и смещения.
Обсуждают сегодня