данных о показателях здоровья человека. Мне нужно сравнить различные показатели в двух группах. Первая группа - принимали препарат (antiplatelet_agents=1), вторая группа - не принимали препарат (antiplatelet_agents = 0). Нужно сравнить,есть ли разница различных показателях (показатели для сравнения в дата сете ich_volume, GCS_before, NIHSS_before, NIHSS, eGOS,mRS)
Я сравнила, используя Mann–Whitney U test. У меня возникают сомнения в правильности моих действий в связи с тем, что для каждого теста я использую немного разные группы людей. Т.е. в дата сете 349 наблюдений. Но для сравнения ich_volume у меня 336 наблюдений, т.к. присутствуют NA, для GCS_before 341 наблюдение.
Вопросы:
1) корректно ли мое сравнение с точки зрения того, что в тестах используется разное количество наблюдений?
2) корректно ли использовать Mann–Whitney U test в моем случае?
Я прикрепляю данные и мой код к сообщению Буду очень благодарна за Ваши и ответы и советы.
Разница в размере выборок незначительная, количество missing values незначительное. Если переменные количественные, более менее нормально распределяются, можно и t test использовать. Проблем с размером выборок не вижу вообще
Спасибо за Ваш ответ. Все так, за исключением нормального распределения, поэтому использую Mann–Whitney U test
Обсуждают сегодня