O que é ANOVA?
H0: as médias de duas ou mais populações são iguais.
Ha: pelo menos uma das médias populacionais é diferente.
O objetivo do teste é olhar a variância de duas populações e ver se as médias dessas populações são iguais ou não. Para que isso aconteça, é necessário:
1 . A distribuição da variável em questão seja Gaussiana para todas as populações;
2. O desvio-padrão seja igual para todas as populações. Ou seja, se as populações tiverem médias diferentes, teremos:
Dicas importantes
A ANOVA One-way é uma técnica para comparar médias usando amostras independentes Quando as amostras são dependentes, deve ser utilizada a ANOVA Two-way com efeito de blocos. Quando a suposição de normalidade dos dados não puder ser feita, existe a alternativa da ANOVA Não paramétrica (Teste de Kruskal-Wallis).
comparar a variabilidade dentro dos grupos (σ2 dentro) com a variabilidade entre os grupos (σ2 entre)
Se H0 for verdadeira, ou seja, as médias entre os grupos não são diferentes
σ2 entre = σ2 dentro
σ2 entre > σ2 dentro
Como comparar σ2 dentro e σ2 entre ?
F= S² entre/S²dentro
Se F ≈ 1, então as médias não podem ser consideradas diferentes (não rejeitamos H0);
Se F >> 1 (grandes), então podemos considerar que existem evidências de que as médias são diferentes (rejeitamos H0).
Dicas importantes
• F-Statistic (Estatística F): Esta é a razão entre a variância explicada pelo modelo (entre os grupos) e a variância não explicada (dentro dos grupos). Um valor alto de F indica que há uma diferença significativa entre as médias dos grupos.
• P-valor (PR(>F)): Indica a probabilidade de observar um valor de F tão extremo quanto o observado, assumindo que a hipótese nula é verdadeira (ou seja, que todas as médias dos grupos são iguais). Um p-valor baixo (geralmente menor que 0,05) sugere que você deve rejeitar a hipótese nula.
• Sum_sq (Soma dos Quadrados): Reflete a variância total, dividida em variância devido ao modelo (variância entre os grupos) e variância residual (variância dentro dos grupos).
• df (Graus de Liberdade): Refere-se ao número de categorias nos dados menos um para a variância do modelo e ao número total de observações menos o número de categorias para a variância residual.
• Normalidade: Verifique a normalidade dos dados. Se os dados não forem normalmente distribuídos, outras abordagens, como transformações ou testes não paramétricos (por exemplo, Kruskal-Wallis), podem ser necessárias.
• Homogeneidade das Variâncias: Use testes como Levene ou Bartlett para verificar a homogeneidade das variâncias. Se as variâncias não forem homogêneas, considere usar ANOVA Welch.
Quando Não Usar: Não use ANOVA se suas variáveis são dependentes, se tem menos de três grupos para comparar, ou se suas variáveis não são quantitativas. Além disso, não use ANOVA se as suposições do teste não forem atendidas.
Resumo
O teste ANOVA permite avaliar a influência de variáveis categóricas sobre uma variável contínua, dois grupos ou mais grupos simultaneamente, e ele é robusto contra pequenos desvios da normalidade na distribuição dos dados. Porém, é um teste que pressupõe que os dados de cada grupo são normalmente distribuídos e têm variações iguais (homocedasticidade). É robusto para pequenos desvios, mas se mostra sensível para presença de outliers.
No Case

