разницы между средними?
1. Бутстрапирование 2 выборок и расчет доверительного интервала разности между средними
2. Бутстрапирование 2 выборок и применение t теста на этих выборках?
И почему второй вариант показывает очень низкий p-value (~0), а первый выше 5%?
Может мне кто нибудь напомнить, почему коэффициент регуляризации в лог. регрессии обратный а не прямой? Этому есть какое нибудь математическое обьяснение?
Пните, когда ответят
Мне кажется первый вариант это самый простой и дефолтный вариант использования. Во втором случае ты считаешь t-test по каждой выборке, и получившееся распределение p-value у тебя сильно скошено в 0, правильно понял?
Не совсем. Есть 2 бутстрапированные выборки с нормальными распределениями из 2 разных выборок. Классический подход - посчитать 95% интервал для разности сгенерированных выборок Но не могу понять чем это отличается от того, что мы сравним эти же сгенерированные выборки т-тестом
То есть, у тебя сейчас есть два распределения средних по группе A и B, которые ты получил из бутстрапа? mean(sample(A, n=len(A))) % REPEAT 10000 mean(sample(B n=len(B))) % REPEAT 10000 Такое?
Обсуждают сегодня