Receba gratuitamente todos os nossos conteúdos.

Fique por dentro das novidades e oportunidades referentes à Psicometria e Análise Quantitativa de Dados.

Homocedasticidade na Regressão Linear

Um dos pressupostos da regressão linear múltipla é que a variância da variável dependente, Y, deve ser constante para os valores das variáveis preditoras X1, X2, …, Xn

Outra maneira de pensar o mesmo fenômeno é que os erros do modelo (resíduos) devem ser constantes, independente dos valores da variável de resultado (Y).

Esse fenômeno é chamado de homocedasticidade ou homogeneidade de variância. Quando não acontece, diz-se que os dados apresentam heterocedasticidade ou heterogeneidade de variância.

Neste post apresentamos três formas de verificar a homogeneidade de variância, um pressuposto importante das regressões. Procure realizar os três métodos. Desta maneira, você terá mais confiança nos resultados das suas análises. Vamos lá!

Como analisar a homocedasticidade por meio do gráfico de Resíduos e Valores Ajustados?

Com o gráfico a seguir ficará mais fácil de entender. Vamos plotar um gráfico de dispersão, por meio de uma Regressão Linear Múltipla. Se você precisar refrescar a memória sobre como a regressão funciona, sugiro os artigos no blog sobre regressão linear e regressão linear simples.

No gráfico, o eixo x representa os valores projetados da variável dependente (Y) por meio da Regressão Linear Múltipla. Já o eixo y representa os resíduos, ou seja, quão distante do valor real estão os valores projetados.

Ao analisar o gráfico acima, é possível perceber que os resíduos não são homogêneos para todos os valores de Y. Há uma maior presença de resíduos negativos próximo dos valores ajustados 4 e 6. Ao mesmo tempo, os resíduos tendem a ser mais positivos abaixo do valor ajustado de 4 e acima de 6.

Como analisar a homocedasticidade por meio do gráfico de Probabilidade Normal dos Resíduos?

Uma outra maneira de observar a heterocedasticidade é por meio do gráfico de Probabilidade Normal dos Resíduos.

Neste gráfico, ainda é possível visualizar os resíduos no eixo y. Mas no eixo x temos os quantis esperados dos resíduos. Este valor esperado existe uma vez que erros aleatórios seguem uma distribuição normal, portanto, se os resíduos não tem distribuição normal, significa que não há homogeneidade de variância.

Neste exemplo, é possível observar que os erros se afastam da linha esperada (a linha sólida), indicando que os erros não são homogêneos, principalmente nos extremos.

Como analisar a homocedasticidade por meio de um teste de normalidade?

Como explicado no gráfico anterior, erros aleatórios devem seguir uma distribuição normal. Desta forma, podemos realizar um teste de normalidade nos resíduos, o teste de Shapiro-Wilk ou Kolmogorov-Smirnov.

Ambos os testes têm como hipótese nula que os dados são normais. Como resultado, valores de p < 0,05 indicam que os resíduos não são normais.

Em nosso exemplo, o teste de Shapiro-Wilk teve como resultado W = 0,98105, p = 0,0306. Assim, nossos erros não são aleatórios e não há homogeneidade de variância dos resíduos.

Gostou desse conteúdo? Precisa aprender Análise de dados? Faça parte da Psicometria Online Academy: a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).

BRUNO FIGUEIREDO DAMÁSIO

Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) eEditor-Associado da Spanish Journal of Psychology, na sub-seção Psicometri e Métodos Quantitativos.

Tenho mais de 50 artigos publicados e mais de 3000 citações, nas melhores revistas nacionais e internacionais. Atualmente, me dedico a formação de novos pesquisadores, através da Psicometria Online Academy. Minha missão é ampliar a formação em Psicometria no Brasil e lhe auxiliar a conquistar os seus objetivos profissionais.

Deseja se tornar completamente autônomo e independente na análise dos seus dados?

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Veja mais

Posts relacionados

Teste de Wilcoxon

Teste de Wilcoxon

O teste de Wilcoxon é um teste de hipóteses para analisar a diferença entre duas amostras pareadas. Portanto, podemos usá-lo quando temos duas medidas de uma mesma amostra, isto é,

O que é um teste post hoc?

O que é um teste post hoc?

Alguma vez, durante a sua jornada como pesquisador, já deve ter se perguntado o que é um teste post hoc ou o que significa fazer um teste post hoc. Testes

O que é a distância de Cook?

O que é a distância de Cook?

A distância de cook é uma estatística para avaliar o quanto um único caso é capaz de influenciar a estimativa de um modelo de regressão.

Entenda o que são graus de liberdade

Entenda o que são graus de liberdade

Os graus de liberdade são uma medida que nos ajuda a determinar o número de observações independentes que temos em nossos dados. Em outras palavras, eles indicam quantos valores podemos

O que são parâmetros livres e fixos em uma AFC?

O que são parâmetros livres e fixos em uma AFC?

Parâmetros livres e fixos são uma parte fundamental para o entendimento da Análise Fatorial Confirmatória (AFC). É útil entender estes conceitos, para quando falarmos de índices de modificação e identificação

Teste de Wilcoxon

Teste de Wilcoxon

O teste de Wilcoxon é um teste de hipóteses para analisar a diferença entre duas amostras pareadas. Portanto, podemos usá-lo quando temos duas medidas de uma mesma amostra, isto é,

O que é um teste post hoc?

O que é um teste post hoc?

Alguma vez, durante a sua jornada como pesquisador, já deve ter se perguntado o que é um teste post hoc ou o que significa fazer um teste post hoc. Testes

O que é a distância de Cook?

O que é a distância de Cook?

A distância de cook é uma estatística para avaliar o quanto um único caso é capaz de influenciar a estimativa de um modelo de regressão.

Entenda o que são graus de liberdade

Entenda o que são graus de liberdade

Os graus de liberdade são uma medida que nos ajuda a determinar o número de observações independentes que temos em nossos dados. Em outras palavras, eles indicam quantos valores podemos

O que são parâmetros livres e fixos em uma AFC?

O que são parâmetros livres e fixos em uma AFC?

Parâmetros livres e fixos são uma parte fundamental para o entendimento da Análise Fatorial Confirmatória (AFC). É útil entender estes conceitos, para quando falarmos de índices de modificação e identificação

Cadastre-se para ser notificado com o link das aulas ao vivo:

Módulo 4: Redes neurais artificiais

• Introdução a Deep Learning

• Avaliando sistemas de Deep Learning

• Redes Neurais feitas (sem programação) no SPSS

• Aula bônus: O futuro da IA na Sociedade

• Aula bônus: Dois Estudos de Caso 

Módulo 3: Interpretar e reportar resultados

• Gerar, interpretar e reportar resultados em Machine Learning

Módulo 2: Criando o seu sistema

• Selecionando algoritmos e métodos 
• Práticas de Machine Learning (Sem programação): Decision Tree (JASP), Linear Discriminant Classification (JASP) e Plataforma ORANGE
• Aula Bônus: Avaliação Psicológica e Machine Learning
• Aula Bônus: Livros e Cursos recomendados  
• Aula Bônus: Entrevista com Cientista de Dados focado na área da Saúde

Módulo 1: O que é Machine Learning

• O que é Machine Learning?
• Como a máquina aprende?
• Machine Learning para Psicometria e Pesquisa Quantitativa (pesquisas comentadas)
• Tipos de Machine Learning (Supervisionado e Não-supervisionado)
• Práticas de Machine Learning (Sem programação): JASP e SPSS
Aula Bônus: Filosofia da Inteligência Artificial
• Aula Bônus: Entrevista com Cientista de Dados graduado em Psicologia
• Aula bônus: Estudo de Caso sobre Redução Dimensional 

Preencha abaixo para
participar gratuitamente

Fique tranquilo, não utilizaremos suas informações de contato para enviar qualquer tipo de SPAM. Os dados coletados são tratados nos termos da Lei Geral de Proteção de Dados e você pode se descadastrar da nossa lista de contatos a qualquer momento.