miksi otoskoko ja vaikutuskoko lisäävät tilastollisen testin tehoa

vaikutuskoko ja tilastollisen testin teho

vaikutuskoko on mittaus, jolla verrataan kahden ryhmän välisen eron kokoa. Se on hyvä toimenpiteen tehokkuuden mittari. Esimerkiksi, jos teemme tutkimuksen kolesterolitason parantamisesta ihmisryhmälle, voisimme laskea vaikutuksen koon ennen/jälkeen eri menetelmiä, kuten ruokavaliota, erilaisia liikuntaa jne. sovelletaan.

vaikutuskoon laskeminen on hyvin suoraviivaista. Se on kahden ryhmän keskiarvojen suhteellinen ero; osoittaja on kahden keskiarvon ero ja nimittäjä on suure, jota haluat käyttää vertailussa, yleensä käytetään jommankumman ryhmän keskihajontaa. Voimme liittää tämän ajatuksen normaalijakaumien empiiriseen sääntöön selvittääksemme, kuinka paljon kahden ryhmän tilastolliset jakaumat ovat päällekkäin. Kun käytämme nimittäjälle merkityksellisintä keskihajontaa, jota kutsutaan standardzieriksi, kutsumme sitä Cohenin d: ksi. On toinenkin Kristoffer Magnussonin luoma suuri interaktiivinen visualisointi Cohenin d-efektin koon tulkitsemiseen.

laskettaessa kahden riippumattoman joukon efektikokoa käytetään usein yhdistettyä keskihajontaa, joka on yhdistetyn varianssin neliöjuuri.

d = keskiarvojen ero / yhdistetty keskihajonta,

yhdistetty varianssi = (n₁× Var₂ +nɛ× Var₂) / (n₂ +nβ)

n₂, n½ : otoskoot kahdelle ryhmälle

Var₂, Var₂ : kahden ryhmän varianssit

efektikoko liittyy läheisesti tilastollisen testin potenssiin, koska kun kahden ryhmän ”ero” on suuri, on ”helppo” hylätä nollahypoteesi.

tarkastellaan seuraavia kahta tapausta:

tapaus 1: vertaamme kahta samansuuruista otosta kahdesta ”hyvin” erilaisesta jakaumasta.

  1. normaalijakauma μ₂=163, σ₁ = 7, 2
  2. normaalijakauma μ₂ = 190, σ₂ = 7.2

tapaus 2: vertaamme kahta näytettä, joilla on yhtäläinen otoskoko kahdesta ”pienestä” eri jakelusta.

  1. normaalijakauma μ₂=163, σ₁ = 7, 2
  2. normaalijakauma μ₂ = 165, σ₂ = 7.2

kun suoritamme kahden näytteen t-testin testaamiseksi yhtä suuri keskiarvo molemmissa tapauksissa, tapaus 1: n testitilasto olisi paljon suurempi kuin tapaus 2: n testitilasto; meillä on vähemmän tyypin 2 virhettä tapauksessa 1 siten suurempi teho.

Vastaa

Sähköpostiosoitettasi ei julkaista.

More: