Effect size and power of a statistical test
an effect size is a measurement to compare the size of difference between two groups. É uma boa medida de eficácia de uma intervenção. Por exemplo, se realizarmos um estudo sobre a melhoria dos níveis de colesterol para um grupo de pessoas, poderíamos calcular um tamanho de efeito para antes/depois de diferentes métodos como dieta, diferentes tipos de exercício etc. são aplicadas.
calculando um tamanho de efeito é muito direto para a frente. É uma diferença relativa de meios de dois grupos; o numerador é a diferença entre dois valores médios e o denominador é uma quantidade que você quer usar para uma comparação, geralmente um desvio padrão de um dos dois grupos é usado. Podemos relacionar esta ideia com a regra empírica das distribuições normais para descobrir a quantidade de distribuições estatísticas de dois grupos que são sobrepostas. Quando usamos o desvio padrão mais relevante para o denominador, chamado de padrão, chamamos de d de Cohen. Há outra grande visualização interativa criada por Kristoffer Magnusson para interpretar o tamanho do efeito d de Cohen.
Quando calculamos um tamanho de efeito de dois conjuntos independentes, muitas vezes usamos um desvio padrão agrupado que é uma raiz quadrada de uma variância agrupada.
d = diferença de médias / pool desvio padrão,
pool variância = (n₁× Var₁ +n₂× Var₂)/ (n₁ +n₂)
n₁, n₂ : tamanhos de amostra para dois grupos
Var₁, Var₂ : variâncias para dois grupos
um tamanho de efeito está intimamente relacionado com um poder de um teste estatístico porque quando a “diferença” de dois grupos é grande, é “fácil” rejeitar a hipótese nula.
considere dois casos seguintes:
caso 1: comparamos duas amostras com o mesmo tamanho de amostra de duas distribuições “muito” diferentes.
- distribuição Normal com μ₁=163, σ₁ = 7.2
- distribuição Normal com μ₂ = 190, σ₂ = 7.2
caso 2: comparação de duas amostras com igual tamanho da amostra a partir de dois “pouco” diferentes distribuições.
- distribuição Normal com μ₁=163, σ₁ = 7.2
- distribuição Normal com μ₂ = 165, σ₂ = 7.2
Quando realizamos um teste t para duas amostragens para o teste de igualdade de média em ambos os casos, o caso 1 do teste estatístico seria muito maior do que o caso 2 do teste estatístico; teremos menos erro de tipo 2 para o caso 1, assim, o poder superior.