effektstorlek och effekt av ett statistiskt test
en effektstorlek är ett mått för att jämföra storleken på skillnaden mellan två grupper. Det är ett bra mått på effektiviteten av en intervention. Om vi till exempel genomför en studie om att förbättra kolesterolnivåerna för en grupp människor kan vi beräkna en effektstorlek för före/efter olika metoder som kost, olika typer av träning etc. tillämpas.
beräkning av en effektstorlek är mycket rakt framåt. Det är en relativ skillnad mellan medel för två grupper; täljaren är skillnaden mellan två medelvärden och nämnaren är en kvantitet som du vill använda för en jämförelse, i allmänhet används en standardavvikelse för en av de två grupperna. Vi kan relatera den här tanken med normalfördelningens empiriska regel för att hitta hur mycket statistiska fördelningar av två grupper överlappas. När vi använder den mest relevanta standardavvikelsen för nämnaren, kallad standardzier, kallar vi det Cohens d. Det finns en annan stor interaktiv visualisering skapad av Kristoffer Magnusson för att tolka Cohens d-effektstorlek.
när vi beräknar en effektstorlek på två oberoende uppsättningar använder vi ofta en poolad standardavvikelse som är en kvadrerad rot av en poolad varians.
d = skillnad mellan medel / poolad standardavvikelse,
poolad varians = (n ^ occl var ^ +n₂ occl var₂)/ (n ^ + n₂)
n^, n₂: provstorlekar för två grupper
var^, Var₂ : avvikelser för två grupper
en effektstorlek är nära relaterad till en kraft i ett statistiskt test eftersom när ”skillnad” i två grupper är stor är det ”lätt” att avvisa nollhypotesen.
överväg att följa två fall:
fall 1: vi jämför två prover med samma provstorlek från två ”mycket” olika fördelningar.
- normalfördelning med ubiqi = 163, ubiqi = 7,2
- normalfördelning med ubiqi = 190, ubiqi = 7.2
fall 2: vi jämför två prover med samma provstorlek från två ”små” olika fördelningar.
- normalfördelning med ubiqi = 163, ubiqi = 7,2
- normalfördelning med ubiqi = 165, ubiqi = 7.2
när vi genomför ett T-test med två prov för att testa lika medelvärde i båda fallen skulle fall 1: s teststatistik vara mycket större än Fall 2: s teststatistik; vi kommer att ha mindre typ 2-fel för fall 1, alltså högre effekt.