например:
удаление.
попытаться интерполировать.
использовать среднее. итд.
Если, например, мы начинаем удалять NA, то некоторые методики анализа начинают «плохо работать» на малых выборках или не работать вообще, а иногда выборки с большим кол-вом NA просто отбраковывают как «данные не подлежат анализу».
При попытках интерполяции, качество рез-тов анализа тоже снижается из-за возрастающей погрешности… итд.
Существует ли какая-либо книженция, доклад, материалы исследования по данной проблеме? а-ля coockbook/recipies: в каких ситуациях как работать с NA. понятно, что крайне маловероятно учесть большинство случаев, но хоть что-то и в одном источнике.
Поделитесь ссылками, если у кого-то в наличии.
Если речь о статистическом выводе, то нужно смотреть MICE или другие стохастические методы восполнения
Из книг чаще всего на эту ссылаются https://www.routledge.com/Flexible-Imputation-of-Missing-Data-Second-Edition/Buuren/p/book/9781032178639
Обсуждают сегодня