Rozmiar efektu i moc testu statystycznego
rozmiar efektu jest pomiarem porównującym rozmiar różnicy między dwiema grupami. Jest to dobra miara skuteczności interwencji. Na przykład, jeśli przeprowadzimy badanie dotyczące poprawy poziomu cholesterolu dla grupy osób, możemy obliczyć wielkość efektu przed / po różnych metodach, takich jak dieta, różne rodzaje ćwiczeń itp. są stosowane.
obliczanie wielkości efektu jest bardzo proste. Jest to względna różnica środków dwóch grup; licznik jest różnicą między dwiema wartościami średnimi, a mianownik jest ilością, którą chcesz użyć do porównania, na ogół stosuje się odchylenie standardowe jednej z dwóch grup. Możemy powiązać tę ideę z regułą empiryczną rozkładów normalnych, aby dowiedzieć się, jak wiele rozkładów statystycznych dwóch grup pokrywa się. Kiedy używamy najbardziej odpowiedniego odchylenia standardowego dla mianownika, zwanego standardzierem, nazywamy go d Cohena. Jest jeszcze jedna świetna interaktywna wizualizacja stworzona przez Kristoffera Magnussona do interpretacji wielkości efektu D Cohena.
kiedy obliczamy wielkość efektu dwóch niezależnych zbiorów, często używamy połączonego odchylenia standardowego, które jest pierwiastkiem kwadratowym połączonej wariancji.
d = różnica średnich / zsumowane odchylenie standardowe,
zsumowana wariancja = (n₁× Var₁ +N₂× Var₂)/ (n₁ +n₂)
n₁, n₂ : rozmiary próbek dla dwóch grup
Var₁, Var₂ : wariacje dla dwóch grup
wielkość efektu jest ściśle związana z mocą testu statystycznego, ponieważ gdy ” różnica „dwóch grup jest duża,” łatwo ” odrzucić hipotezę zerową.
rozważ następujące dwa przypadki:
przypadek 1: porównujemy dwie próbki z równą wielkością próbki z dwóch „bardzo” różnych rozkładów.
- rozkład normalny z μ₁=163, σ σ = 7,2
- rozkład normalny z μ₂ = 190, σ₂ = 7.2
przypadek 2: porównujemy dwie próbki z równą wielkością próbki z dwóch „małych”różnych rozkładów.
- rozkład normalny z μ₁=163, σ σ = 7,2
- rozkład normalny z μ₂ = 165, σ₂ = 7.2
kiedy przeprowadzamy test T z dwiema próbkami dla testowania równej średniej w obu przypadkach, statystyka testu przypadku 1 byłaby znacznie większa niż statystyka testu przypadku 2; będziemy mieli mniejszy błąd typu 2 Dla Przypadku 1, a zatem wyższą moc.