El tamaño del efecto y la potencia de una prueba estadística
Un tamaño de efecto es una medida para comparar el tamaño de la diferencia entre dos grupos. Es una buena medida de la eficacia de una intervención. Por ejemplo, si realizamos un estudio sobre la mejora de los niveles de colesterol para un grupo de personas, podríamos calcular el tamaño del efecto para antes/después de diferentes métodos como dieta, diferentes tipos de ejercicio, etc. se aplican.
Calcular el tamaño de un efecto es muy sencillo. Es una diferencia relativa de medias de dos grupos; el numerador es la diferencia entre dos valores medios y el denominador es una cantidad que desea usar para una comparación, generalmente se usa una desviación estándar de uno de los dos grupos. Podemos relacionar esta idea con la regla empírica de distribuciones normales para encontrar cuántas distribuciones estadísticas de dos grupos se superponen. Cuando usamos la desviación estándar más relevante para el denominador, llamado el standardzier, lo llamamos d de Cohen. Hay otra gran visualización interactiva creada por Kristoffer Magnusson para interpretar el tamaño del efecto d de Cohen.
Cuando calculamos un tamaño de efecto de dos conjuntos independientes, a menudo usamos una desviación estándar agrupada que es una raíz cuadrada de una varianza agrupada.
d = diferencia de medios / agruparon desviación estándar,
agrupado varianza = (n₁× Var₁ +n₂× Var₂)/ (n₁ +n₂)
n₁, n₂ : tamaños de muestra para los dos grupos
Var₁, Var₂ : varianzas para dos grupos
El tamaño de un efecto está estrechamente relacionado con la potencia de una prueba estadística porque cuando la «diferencia» de dos grupos es grande, es «fácil» rechazar la hipótesis nula.
Considere los siguientes dos casos:
caso 1: Comparamos dos muestras con el mismo tamaño de muestra de dos distribuciones» muy » diferentes.
- Distribución normal con μ= = 163, σ σ = 7.2
- Distribución normal con μ₂ = 190, σ₂ = 7.2
caso 2: Comparamos dos muestras con el mismo tamaño de muestra de dos distribuciones» pequeñas » diferentes.
- Distribución normal con μ= = 163, σ σ = 7.2
- Distribución normal con μ₂ = 165, σ₂ = 7.2
Cuando realizamos una prueba t de dos muestras para probar la media igual en ambos casos, la estadística de prueba del caso 1 sería mucho mayor que la estadística de prueba del caso 2; tendremos menos error de tipo 2 para el caso 1, por lo tanto, la potencia más alta.