Effektgröße und Stärke eines statistischen Tests
Eine Effektgröße ist eine Messung zum Vergleich der Größe der Differenz zwischen zwei Gruppen. Es ist ein gutes Maß für die Wirksamkeit einer Intervention. Wenn wir zum Beispiel eine Studie zur Verbesserung des Cholesterinspiegels für eine Gruppe von Menschen durchführen, könnten wir eine Effektgröße für vor / nach verschiedenen Methoden wie Diät, verschiedene Arten von Bewegung usw. berechnen. angewendet werden.
Die Berechnung einer Effektgröße ist sehr einfach. Es ist eine relative Differenz der Mittelwerte zweier Gruppen; Der Zähler ist die Differenz zwischen zwei Mittelwerten und der Nenner ist eine Größe, die Sie für einen Vergleich verwenden möchten. Wir können diese Idee mit der empirischen Regel der Normalverteilungen in Beziehung setzen, um herauszufinden, wie stark sich statistische Verteilungen zweier Gruppen überlappen. Wenn wir die relevanteste Standardabweichung für den Nenner verwenden, den Standardzier, nennen wir ihn Cohens d. Es gibt eine weitere großartige interaktive Visualisierung, die von Kristoffer Magnusson erstellt wurde, um Cohens d-Effektgröße zu interpretieren.
Wenn wir eine Effektgröße von zwei unabhängigen Mengen berechnen, verwenden wir oft eine gepoolte Standardabweichung, die eine quadratische Wurzel einer gepoolten Varianz ist.
d = Mittelwertdifferenz / gepoolte Standardabweichung,
gepoolte Varianz = (n₁× var₁ +n₂× Var₂)/ (n₁ +n₂)
n₁, n₂ : Stichprobengrößen für zwei Gruppen
var₁, Var₂ : varianzen für zwei Gruppen
Eine Effektgröße hängt eng mit einer Potenz eines statistischen Tests zusammen, denn wenn der „Unterschied“ zweier Gruppen groß ist, ist es „einfach“, die Nullhypothese abzulehnen.
Betrachten Sie die folgenden zwei Fälle:
Fall 1: Wir vergleichen zwei Stichproben mit der gleichen Stichprobengröße aus zwei „sehr“ unterschiedlichen Verteilungen.
- Normalverteilung mit μ₁=163, σ₁ = 7.2
- Normalverteilung mit μ₂ = 190, σ₂ = 7.2
fall 2: Wir vergleichen zwei Stichproben mit der gleichen Stichprobengröße aus zwei „kleinen“ verschiedenen Verteilungen.
- Normalverteilung mit μ₁=163, σ₁ = 7.2
- Normalverteilung mit μ₂ = 165, σ₂ = 7.2
Wenn wir einen t-Test mit zwei Stichproben durchführen, um in beiden Fällen den gleichen Mittelwert zu testen, wäre die Teststatistik von Fall 1 viel größer als die Teststatistik von Fall 2. Wir haben weniger Typ-2-Fehler für Fall 1, also die höhere Potenz.