распределение классов (фото из инета). Часть данных одного класса залезает в область данных другого. Нейросеть будет иметь ошибку определения класса для таких данных. Есть ли алгоритмы отсеивания таких данных через саму нейросеть?
Например, есть элементы класса [0, 1, 2, 3, 4]. При этом данные эелемента 0 (например, зелёные точки на фотках) находятся в куче оранжевых. Ошибка на финале обучения будет 20%. Есть ли механизм/алгоритм (без предварительной обработки/отсева данных), позволяющий определить какой элемент выпадает из выборки и исключить его?
А вообще нужен вам такой скрипт - анализа влияния данных датасета на уровень ошибки обучения?
Обсуждают сегодня