в вычислениях. Убедительная просьба не спрашивать глобально что и зачем, для чего все это, очень прошу смотреть на суть. В общем предположим есть парсер объявлений по доскам в определенной категории, пусть это будут смартфоны. Парсер пробегает по всем доскам и собирает со всех объявлений о продаже смартфонов цену. В результате получается некий пул цен, из которых затем нужно получить среднее значение - то есть узнать среднюю цену по смартфону на всех досках. НО. Все бы ничего, если бы некоторые объявлени не содержали "ошибочных" цен: к примеру некоторые объявления содержат цену в 1 рубль, а какие-то - миллион рублей за товар. Как следствия, такие значения не позволят вычислить объективную стоимость модели телефона по рынку. Собственно вопрос - каким образом можно исключить эти ошибочные значения и высчитать объективную среднюю стоимость продукта из всех оставшихся значений? Спасибо
вам нужна медиана.
Еще можно отсекать экстремальные значения: N процентов самых больших и маленьких значений.
Этот процент надо подобрать, но он обычно варьируется от 1 до 10 процентов
вспоминается статистика и всякие t-критерии Стьюдента
медиана
сто раз уже обсуждалось - для этого есть хи-квадрат
Обсуждают сегодня