Receba gratuitamente todos os nossos conteúdos.

Fique por dentro das novidades e oportunidades referentes à Psicometria e Análise Quantitativa de Dados.

Tutorial: Quando e como utilizar Análise de Variância (ANOVA)

Podemos iniciar esclarecendo qual a diferença entre ANOVA e Teste t de amostras independentes. Usamos testes t para comparar as pontuações de dois grupos ou condições diferentes. Porém, em muitas situações de pesquisa, no entanto, estamos interessados em comparar as pontuações médias de mais de dois grupos.

Nessa situação, usamos a análise de variância (ANOVA). Portanto, enquanto os testes t comparam as médias de dois grupos/condições, a análise de variância (ANOVA) de uma via compara as médias de 3 ou mais grupos/condições

Na prática, quando usar o teste ANOVA? Usamos ANOVA, por exemplo, ao comparar escores de ansiedade por faixa etária, você teria um fator (escore de ansiedade) com três níveis (por exemplo, jovens, adultos e idosos). A variável dependente é uma variável contínua (neste caso, pontuações em uma escala de ansiedade).

Por que não apenas várias comparações pareadas? Se houver 4 grupos (A, B, C, D), por exemplo, e as diferenças forem comparadas usando testes t múltiplos:

A vs. B P<0,05 95% sem erro tipo I
A vs. C P<0,05 95% sem erro tipo I
A vs. D P<0,05 95% sem erro tipo I
B vs. C P<0,05 95% sem erro tipo I
B vs. D P<0,05 95% sem erro tipo I
C vs. D P<0,05 95% sem erro tipo I
Assumindo que cada teste fosse independente, a probabilidade geral seria:

0.95 * 0.95 * 0.95 * 0.95 * 0.95 * 0.95 = 0.735

Isso é conhecido como familywise error ou erro do Tipo I acumulado, e, nesse caso, resulta em apenas 73,5% de probabilidade de nenhum erro tipo I, pelo qual a hipótese nula pode ser rejeitada quando é verdadeira. Isso é superado pelo uso de testes post hoc que fazem múltiplas comparações pareadas com critérios de aceitação mais rígidos para evitar erros familiares – Vamos falar mais sobre isso mais para frente!

Como calcular ANOVA?

Existem dois métodos para calcular-se a variância: dentro dos grupos (within – SSW) e a variância das médias (MS) e entre os grupos (Between – SSB). Na sequencia é calculada a média dos quadrados das fontes de variação – dentro dos grupos (SSW) e entre os grupos (SSB) utilizando os graus de liberdade de cada um deles, como é exibido no quadro abaixo.

Na sequencia, é calculado uma estatística F, que representa a variância entre os grupos dividida pela variância dentro dos grupos. Um valor alto de F indica que há mais variabilidade entre os grupos (causada pela variável independente) do que dentro de cada grupo.

Mas não se assuste, a ANOVA é um teste bastante difundido, você pode executa-lo em inúmeros softwares estatísticos e não precisa calcular tudo à mão! Inclusive, neste post, vamos ver um tutorial de como executar e como interpretar a tabela ANOVA.

Para esse tutorial vamos o exemplo do livro gratuito: STATISTICAL ANALYSIS IN JASP: A GUIDE FOR STUDENTS, portanto vamos utilizar o software estatístico gratuito JASP (download) e a base de dados, a qual contém uma coluna contendo as 3 dietas usadas (A, B e C) e outra coluna contendo a quantidade absoluta de perda de peso após 8 semanas em uma das 3 dietas diferentes (download base de dados).

Vamos lá!

Após fazer o download do banco de dados e abri-lo no JASP, vá para ANOVA > ANOVA, coloque a perda de peso na Variável Dependente e os agrupamentos de Dieta na caixa Fatores Fixos. Na primeira instância, marque Estatísticas descritivas e ω2 como o tamanho do efeito.

Na sequência, temos que checar os pressupostos do teste.

A variável independente deve ser categórica e a variável dependente deve ser contínua.
• Os grupos devem ser independentes entre si.
• A variável dependente deve ter distribuição aproximadamente normal.
• Não deve haver outliers significativos.
• Deve haver homogeneidade de variância entre os grupos, caso contrário, o valor p para a estatística F pode não ser confiável.
As duas primeiras suposições geralmente são controladas por meio do uso de um projeto de método de pesquisa apropriado. Se as três últimas suposições forem violadas, o equivalente não paramétrico, Kruskal-Wallis, deve ser considerado.

Automaticamente, vamos ter três tabelas e um gráfico (plot) Q-Q dos resíduos.

Como interpretar a tabela ANOVA?

A Tabela da ANOVA é como você está vendo logo abaixo.

A tabela ANOVA principal mostra que a estatística F é significativa (p<0,001) e que existe um grande tamanho de efeito. Portanto, existe uma diferença significativa entre as médias dos 3 grupos de dieta. Mas agora você estar se perguntando: Qual linha devo me basear para reportar tal resultado?

Antes de interpretar a Tabela ANOVA, temos que checar o pressuposto da homogeneidade e assim saber qual linha devemos reportar.

A opção de homogeneidade de variância fornece o teste de Levene para homogeneidade de variâncias, que testa se a variância nas pontuações é a mesma para cada um dos três grupos. Verifique o valor de significância (Sig.) para o teste de Levene. Se esse número for maior que 0,05 (por exemplo, 0,08, 0,28), você não violou a suposição de homogeneidade da variância.

Neste exemplo, o Sig. o valor é 0,280. Como é maior que 0,05, não violamos a hipótese de homogeneidade da variância. Se você descobriu que violou essa suposição, precisará consultar a tabela na saída intitulada Testes Robustos de Igualdade de Meios. Os dois testes ali mostrados (Welch e Brown-Forsythe) são preferíveis quando o pressuposto da homogeneidade da variância é violado.

O gráfico Q-Q mostra que os dados parecem ser normalmente distribuídos e lineares. Além disso, as estatísticas descritivas sugerem que a Dieta 3 resulta na maior perda de peso após 8 semanas.

Todavia, ainda não sabermos se essa diferença é estatisticamente significativa. Como vimos, a tabela ANOVA principal mostra que a estatística F é significativa (p<0,001), mas entre qual ou quais grupos esta diferença é estatisticamente significativa.

O teste post hoc pode agora ser realizado. Em Testes Post Hoc, adicione Dieta à caixa de análise à direita, marque Tipo padrão, use Tukey para a correção post hoc e marque as comparações significativas.

O teste post hoc mostra que não há diferença significativa entre a perda de peso nas dietas A e B. No entanto, é significativamente maior na dieta C em comparação com a dieta A (p<0,001) e a dieta B (p=0,001). O d de Cohen mostra que essas diferenças têm um grande tamanho de efeito.

Como reportar os resultados do teste ANOVA?

O teste de Levene mostrou que houve variância igual para todos os três grupos: F(2,69) = 1,3, p=,28.
ANOVA de uma via independente mostrou um efeito significativo do tipo de dieta na perda de peso após 10 semanas (F (2, 69) =46,184, p<0,001, O ω2 = 0,214 sugerindo que este é um tamanho de efeito grande.
Testes post hoc usando comparações pareadas das médias marginais estimadas com correção de Tukey revelaram que a dieta C resultou em perda de peso significativamente maior (M = 5,59, SD = 2,1 kg) do que a dieta A (M = 3,0, SD = 2,36 kg, p< 0,001) ou dieta B (M = 3,41, SD = 2,36 kg, p=0,001). Não houve diferenças significativas na perda de peso entre as dietas A e B (p=0,777).

Esperamos que com esse tutorial, tenha ficado claro para você o que é e como realizar uma ANOVA.

Gostou desse conteúdo? Precisa aprender Análise de dados? Faça parte da Psicometria Online Academy: a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).

BRUNO FIGUEIREDO DAMÁSIO

Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) eEditor-Associado da Spanish Journal of Psychology, na sub-seção Psicometri e Métodos Quantitativos.

Tenho mais de 50 artigos publicados e mais de 3000 citações, nas melhores revistas nacionais e internacionais. Atualmente, me dedico a formação de novos pesquisadores, através da Psicometria Online Academy. Minha missão é ampliar a formação em Psicometria no Brasil e lhe auxiliar a conquistar os seus objetivos profissionais.

Deseja se tornar completamente autônomo e independente na análise dos seus dados?

Uma resposta

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Veja mais

Posts relacionados

Um Guia Completo sobre a PEDro: Physiotherapy Evidence Database

Um Guia Completo sobre a PEDro: Physiotherapy Evidence Database

Se você é um profissional ou um estudante da área da saúde e está interessado nas práticas baseadas em evidências, este post é para você. Vamos descobrir como a base

Diferença entre as regressões logísticas: binária, ordinal e multinomial

Diferença entre as regressões logísticas: binária, ordinal e multinomial

A análise de regressão é uma técnica amplamente utilizada para verificar a existência de uma relação entre uma variável dependente e uma ou mais variáveis independentes. Existem diferentes tipos de

Construção de itens para instrumentos de autorrelato

Construção de itens para instrumentos de autorrelato

A elaboração de itens para instrumentos de autorrelato desempenha um papel crucial na pesquisa psicométrica, pois é por meio deles que os participantes expressam suas próprias experiências e percepções. Neste

Dados Normativos: Entendendo o Escore Z

Dados Normativos: Entendendo o Escore Z

Interpretar os resultados derivados do uso de um teste é tão crucial quanto criar ou adaptar os instrumentos e aplicá-los corretamente. Para a interpretação dos resultados, é essencial a criação

Compreendendo a Confiabilidade Duas-Metades (Split-Half Reliabity)

Compreendendo a Confiabilidade Duas-Metades (Split-Half Reliabity)

No campo da Psicometria, pesquisadores e profissionais frequentemente buscam garantir a precisão e consistência de seus instrumentos de medição. Um dos métodos usados para avaliar a confiabilidade de um teste

Um Guia Completo sobre a PEDro: Physiotherapy Evidence Database

Um Guia Completo sobre a PEDro: Physiotherapy Evidence Database

Se você é um profissional ou um estudante da área da saúde e está interessado nas práticas baseadas em evidências, este post é para você. Vamos descobrir como a base

Diferença entre as regressões logísticas: binária, ordinal e multinomial

Diferença entre as regressões logísticas: binária, ordinal e multinomial

A análise de regressão é uma técnica amplamente utilizada para verificar a existência de uma relação entre uma variável dependente e uma ou mais variáveis independentes. Existem diferentes tipos de

Construção de itens para instrumentos de autorrelato

Construção de itens para instrumentos de autorrelato

A elaboração de itens para instrumentos de autorrelato desempenha um papel crucial na pesquisa psicométrica, pois é por meio deles que os participantes expressam suas próprias experiências e percepções. Neste

Dados Normativos: Entendendo o Escore Z

Dados Normativos: Entendendo o Escore Z

Interpretar os resultados derivados do uso de um teste é tão crucial quanto criar ou adaptar os instrumentos e aplicá-los corretamente. Para a interpretação dos resultados, é essencial a criação

Compreendendo a Confiabilidade Duas-Metades (Split-Half Reliabity)

Compreendendo a Confiabilidade Duas-Metades (Split-Half Reliabity)

No campo da Psicometria, pesquisadores e profissionais frequentemente buscam garantir a precisão e consistência de seus instrumentos de medição. Um dos métodos usados para avaliar a confiabilidade de um teste

Cadastre-se para ser notificado com o link das aulas ao vivo:

Módulo 4: Redes neurais artificiais

• Introdução a Deep Learning

• Avaliando sistemas de Deep Learning

• Redes Neurais feitas (sem programação) no SPSS

• Aula bônus: O futuro da IA na Sociedade

• Aula bônus: Dois Estudos de Caso 

Módulo 3: Interpretar e reportar resultados

• Gerar, interpretar e reportar resultados em Machine Learning

Módulo 2: Criando o seu sistema

• Selecionando algoritmos e métodos 
• Práticas de Machine Learning (Sem programação): Decision Tree (JASP), Linear Discriminant Classification (JASP) e Plataforma ORANGE
• Aula Bônus: Avaliação Psicológica e Machine Learning
• Aula Bônus: Livros e Cursos recomendados  
• Aula Bônus: Entrevista com Cientista de Dados focado na área da Saúde

Módulo 1: O que é Machine Learning

• O que é Machine Learning?
• Como a máquina aprende?
• Machine Learning para Psicometria e Pesquisa Quantitativa (pesquisas comentadas)
• Tipos de Machine Learning (Supervisionado e Não-supervisionado)
• Práticas de Machine Learning (Sem programação): JASP e SPSS
Aula Bônus: Filosofia da Inteligência Artificial
• Aula Bônus: Entrevista com Cientista de Dados graduado em Psicologia
• Aula bônus: Estudo de Caso sobre Redução Dimensional 

Preencha abaixo para
participar gratuitamente

Fique tranquilo, não utilizaremos suas informações de contato para enviar qualquer tipo de SPAM. Os dados coletados são tratados nos termos da Lei Geral de Proteção de Dados e você pode se descadastrar da nossa lista de contatos a qualquer momento.