Но с поправкой на то, что в разные года было разное количество сегментов исследовано, а судна исследовавшие сегменты проплывали разные дистанции. Правильно ли я понимаю, что в данном случае нужно использовать взвешенное среднее? Можно ли во взвешенном среднем использовать два параметра для весов?
zooplankton %>%
group_by(Year) %>%
summarise(mean = weighted.mean(Total_abundance, Segment_No,Segment_Length, na.rm = TRUE))
Это учебная задача или реальная? Если реальная, то тут должен быть иной подход: такие исследования делаются с целью мониторинга, поэтому нужно иметь возможнсоть сравнивать полученные вами значения и значения, полученные другими исследователями. Поэтому в каждой отрасли (по классам организмов) есть свои наработанные методики (которые могут быть устаревшими или даже не всегда применимыми), но именно эти методики — классические, и которые нужно реализовывать, чтобы результаты были сравнимы с предыдущими исследователями. А всё остальное (в том числе изобретение новых методик) уже факультативно. Поэтому вам нужно поднять литературу конкретно по методикам по вашим организмам и посмотреть, как их мониторят. (Например, когда я работал по подсчету тигров, то в ходу у "тигрологов" была такая методика: https://kolesovdmitry.github.io/logbook/tigers-on-trails-occupancy-modeling-for-cluster-sampling.html), и ее пришлось реализовывать, хотя не все положения методики были логичны. Думаю, что в вашей отрасли существует плюс-минус подобная основная статья. P.S. Все сказанное имеет смысл, если вы работаете не над учебной задачей. Если задача учебная — то там другие подходы
Спасибо за развёрнутый ответ. Это учебная задача.
Тогда зависит от того, насколько глубоко вы хотите закопаться. В первом приближении - да, можно использовать средневзвешенное. Но там попадетесь на том, что плотность размещения планктона в пространстве неоднородна и у близких точек мониторинга получатся близкие значения плотностей. (Тут близость как во времени, так и в пространстве). Поэтому на следующем этапе нужно смотреть, как бороться с подобной корреляцией в данных
Дело в том, что в задании не нужно глубоко погружаться в теорию. Оно больше направлено на отработку R.
Понял. Тогда конечно хватит средневзвешенного
Обсуждают сегодня