«корзины» и внутри каждой корзины производит квантование согласно Min Entropy?
Под “корзиной” обычно понимается уже результат квантизации. То есть на первом шаге алгоритм сортирует и группирует значения фичи по всем объектам -> получаем набор пар (feature_value, num_objects). num_objects это то же самое, что weight. Дальше мы хотим выбрать оптимальные границы для разбиения этих пар в корзины. Делается это жадным образом - сначала у нас есть одна большая корзина, которая делится на две, выбирая точку разбиения по заданному критерию. В случае MinEntropy мы хотим, чтобы splitScore = Entropy(totalWeight) - Entropy(leftWeight) - Entropy(rightWeight) был как можно больше. Потом из двух получившихся корзин делится та, которая дает лучший splitScore.
Обсуждают сегодня