hvorfor prøvestørrelse og effektstørrelse øker effekten av en statistisk test

Effektstørrelse og effekt av en statistisk test

en effektstørrelse er et mål for å sammenligne størrelsen på forskjellen mellom to grupper. Det er et godt mål på effektiviteten av en intervensjon. For eksempel, hvis vi gjennomfører en studie om å forbedre kolesterolnivået for en gruppe mennesker, kan vi beregne en effektstørrelse for før / etter forskjellige metoder som kosthold, ulike typer trening etc. brukes.

Beregning av en effektstørrelse er veldig rett frem. Telleren er forskjellen mellom to middelverdier og nevneren er en mengde du vil bruke til en sammenligning, vanligvis brukes en standardavvik for en av de to gruppene. Vi kan relatere denne ideen med normalfordelingens empiriske regel for å finne ut hvor mye statistiske fordelinger av to grupper overlappes. Når vi bruker det mest relevante standardavviket for nevneren, kalt standardzier, kaller Vi Det Cohens d. Det er en annen stor interaktiv visualisering skapt Av Kristoffer Magnusson For Å Tolke Cohens d-effektstørrelse.

når vi beregner en effektstørrelse på to uavhengige sett, bruker vi ofte et samlet standardavvik som er en kvadrert rot av en samlet varians.

d = forskjell på middel / sammenslått standardavvik,

sammenslått varians = (n ^ × Var ^ +n₂× var₂)/ (n ^ +n₂)

nh, n₂: utvalgsstørrelser for to grupper

Varitius, Var₂ : avvik for to grupper

en effektstørrelse er nært knyttet til en effekt av en statistisk test fordi når » forskjell «av to grupper er stor, er det» lett » å avvise nullhypotesen.

Vurder følgende to tilfeller:

sak 1: vi sammenligner to prøver med samme utvalgsstørrelse fra to «veldig» forskjellige fordelinger.

  1. normal distribusjon med μ=163, σ = 7.2
  2. Normal distribusjon med μ = 190, σ = 7.2

sak 2: vi sammenligner to prøver med samme prøvestørrelse fra to » små » forskjellige fordelinger.

  1. normal distribusjon med μ=163, σ = 7.2
  2. Normal distribusjon med μ = 165, σ = 7.2

Når vi utfører en t-test med to prøver for å teste like gjennomsnitt på begge tilfeller, vil case 1s teststatistikk være mye større enn case 2s teststatistikk; vi vil ha mindre type 2-feil for case 1, og dermed høyere kraft.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert.

More: