Receba gratuitamente todos os nossos conteúdos.

Fique por dentro das novidades e oportunidades referentes à Psicometria e Análise Quantitativa de Dados.

O que é Correlação de Pearson

O Coeficiente de Correlação de Pearson é uma técnica para medir se duas variáveis estão relacionadas de maneira linear. Esta técnica também pode ser chamada de r de Pearson, Correlação Produto-Momento de Pearson ou mais coloquialmente de correlação de Pearson.

O que a relação linear entre variáveis?

A relação linear entre duas variáveis significa que o aumento em uma das variáveis está relacionado com um aumento na outra variável, sempre na mesma proporção.

Em termos gráficos fica simples de entender. Nos gráficos de distribuição a seguir, o eixo “x” representa uma variável, o eixo “y” representa outra variável e cada ponto representa um caso.

No primeiro gráfico, é possível perceber que os dados seguem bem próximos à linha azul. Agora, observe como no segundo gráfico não existe tendência linear nos dados, que seguem mais afastados da linha pontilhada.

Gráfico de distribuição de duas variáveis relacionadas de maneira linear
Gráfico de distribuição de duas variáveis não relacionadas

Com isso em mente, é importante lembrarmos duas coisas sobre relações lineares:

  • A mudança em uma variável está associada à mudança na outra variável (para mais ou para menos)
  • Esta mudança é sempre constante: não importa se “x” aumenta de 1 para 2 ou de 50 para 51. Sempre que aumentarmos uma unidade no valor de “x”, espera-se que o valor aumentado em “y” será o mesmo.

O que significam os resultados do r de Pearson?

No r de Pearson, a métrica da linearidade entre variáveis é exposta em um número que vai de -1 a +1. Quanto mais próximo dos extremos (-1 ou 1), maior é a força da correlação. Valores próximos de zero querem dizer a correlação é fraca.

O valor ser negativo ou positivo indica a direção desta relação. Se positiva, o aumento em uma variável implica no aumento na outra variável. Já os valores negativos indicam que o aumento de uma variável implica no decréscimo de outra, como no gráfico a seguir:

Gráfico de distribuição de duas variáveis relacionadas de maneira linear e inversa

Os gráficos a seguir demonstram vários níveis de correlação em diferentes gráficos de pontos.

Como interpretar valores do coeficiente de correlação?

Até aqui, você deve ter uma noção de como interpretar a direção e magnitude da correlação, mas pode querer uma interpretação mais objetiva do significado dos números apresentados nos testes de correlação. Infelizmente, não existe consenso sobre o a interpretação do poder da correlação. O que existe são algumas recomendações.

Cohen (1992) sugere os seguintes tamanhos de efeito:

  • r = |0,10| -> correlação fraca.
  • r = |0,30| -> correlação moderada.
  • r = |0,50| -> correlação forte.

O artigo “How to Interpret a Correlation Coefficient r – dummies” (2019) sugere que:

  • r = |0,30| -> correlação fraca
  • r = |0,50| -> correlação moderada
  • r = |0,70| -> correlação forte

Como avaliar a correlação através do coeficiente de determinação (Tamanho de efeito)

Além das recomendações acima, podemos interpretar a correlação através do . Elevar o r ao quadrado indica em quantos porcentos a variância de uma variável explica a outra. Isso é chamado Variância Explicada. Por exemplo, r = 0,10, significa que 1% da variação de uma variável pode ser explicada pela outra. Já r = 0,30 explica 9% da variância total e r = 0,50 explica 25% da variância total.

Apesar destas recomendações, é importante entender que sugestões de interpretação podem ser arbitrárias. Para determinar se o tamanho de efeito é forte ou não, é preciso sempre olhar o contexto em que ele se aplica.

Qual a importância da significância estatística para a correlação de Pearson?

Ao analisar correlações, não se esqueça que, como em qualquer estatística frequentista, é necessário olhar os valores de significância dos testes (o valor de p). É comum nas ciências humanas e sociais aceitarmos valores de correlações (e demais testes) quando p for menor do que 0,05 (p < 0,05).

É possível ser ainda mais rigoroso utilizando técnicas de reamostragem, possibilitando informar os valores de Intervalos de Confiança (IC) do r. Neste caso, nós consideraríamos que os valores de r são confiáveis quando os intervalos não tem sinais diferentes.

Por exemplo, podemos confiar no valor de r = 0,30, com IC 95% = 0,15 a 0,45, uma vez que no intervalo de confiança não passamos pelo eixo zero, então ambos os valores são positivos. Nós não poderíamos confiar em um resultado de r = 0,30, com IC 95% = -0,05 a 0,35. Neste último caso, temos valores positivos e negativos, o que é um indicativo de um valor de r não confiável. Em postagens futuras iremos abordar intervalos de confiança com mais detalhes.

Quando não utilizar a correlação de Pearson?

A correlação de Pearson, apesar de muito útil, não pode ser utilizada em qualquer contexto. Você deve procurar alternativas à correlação de Pearson quando:

  • A relação entre as variáveis não é linear
  • As variáveis não são contínuas

Se a sua análise se encaixa nestes critérios, você pode procurar alternativas em testes não-paramétricos, como tau de Kendall e o rho de Spearman. Ambos já tem publicações aqui no nosso blog.

E aí? Ficou claro para você o que é a Correlação de Pearson? Comente abaixo ou tire suas dúvidas!

Gostou desse conteúdo? Precisa aprender Análise de dados? Faça parte da Psicometria Online Academy: a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).

BRUNO FIGUEIREDO DAMÁSIO

Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) eEditor-Associado da Spanish Journal of Psychology, na sub-seção Psicometri e Métodos Quantitativos.

Tenho mais de 50 artigos publicados e mais de 3000 citações, nas melhores revistas nacionais e internacionais. Atualmente, me dedico a formação de novos pesquisadores, através da Psicometria Online Academy. Minha missão é ampliar a formação em Psicometria no Brasil e lhe auxiliar a conquistar os seus objetivos profissionais.

Deseja se tornar completamente autônomo e independente na análise dos seus dados?

7 respostas

  1. O coeficiente de correlação representado pela letra “r” pode variar entre -1 e +1. Quando os valores “r” são negativos, a correlação é classificada como do tipo inversa, já quando os valores de “r” são positivos a correlação é direta.
    essa afirmativa é correta ?
    sou estudante de farmácia

    1. Inversa e direta talvez não sejam os termos mais usuais, Luiz: Correlação positiva e Correlação Negativa é o que mais você vai encontrar. E sim, só muda a direção da associação (quando uma variável sobe, outra sobe – correlação positiva; quando uma variável sobre, outra desce – correlação negativa).

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Veja mais

Posts relacionados

Teste de Wilcoxon

Teste de Wilcoxon

O teste de Wilcoxon é um teste de hipóteses para analisar a diferença entre duas amostras pareadas. Portanto, podemos usá-lo quando temos duas medidas de uma mesma amostra, isto é,

O que é um teste post hoc?

O que é um teste post hoc?

Alguma vez, durante a sua jornada como pesquisador, já deve ter se perguntado o que é um teste post hoc ou o que significa fazer um teste post hoc. Testes

O que é a distância de Cook?

O que é a distância de Cook?

A distância de cook é uma estatística para avaliar o quanto um único caso é capaz de influenciar a estimativa de um modelo de regressão.

Entenda o que são graus de liberdade

Entenda o que são graus de liberdade

Os graus de liberdade são uma medida que nos ajuda a determinar o número de observações independentes que temos em nossos dados. Em outras palavras, eles indicam quantos valores podemos

O que são parâmetros livres e fixos em uma AFC?

O que são parâmetros livres e fixos em uma AFC?

Parâmetros livres e fixos são uma parte fundamental para o entendimento da Análise Fatorial Confirmatória (AFC). É útil entender estes conceitos, para quando falarmos de índices de modificação e identificação

Teste de Wilcoxon

Teste de Wilcoxon

O teste de Wilcoxon é um teste de hipóteses para analisar a diferença entre duas amostras pareadas. Portanto, podemos usá-lo quando temos duas medidas de uma mesma amostra, isto é,

O que é um teste post hoc?

O que é um teste post hoc?

Alguma vez, durante a sua jornada como pesquisador, já deve ter se perguntado o que é um teste post hoc ou o que significa fazer um teste post hoc. Testes

O que é a distância de Cook?

O que é a distância de Cook?

A distância de cook é uma estatística para avaliar o quanto um único caso é capaz de influenciar a estimativa de um modelo de regressão.

Entenda o que são graus de liberdade

Entenda o que são graus de liberdade

Os graus de liberdade são uma medida que nos ajuda a determinar o número de observações independentes que temos em nossos dados. Em outras palavras, eles indicam quantos valores podemos

O que são parâmetros livres e fixos em uma AFC?

O que são parâmetros livres e fixos em uma AFC?

Parâmetros livres e fixos são uma parte fundamental para o entendimento da Análise Fatorial Confirmatória (AFC). É útil entender estes conceitos, para quando falarmos de índices de modificação e identificação

Cadastre-se para ser notificado com o link das aulas ao vivo:

Módulo 4: Redes neurais artificiais

• Introdução a Deep Learning

• Avaliando sistemas de Deep Learning

• Redes Neurais feitas (sem programação) no SPSS

• Aula bônus: O futuro da IA na Sociedade

• Aula bônus: Dois Estudos de Caso 

Módulo 3: Interpretar e reportar resultados

• Gerar, interpretar e reportar resultados em Machine Learning

Módulo 2: Criando o seu sistema

• Selecionando algoritmos e métodos 
• Práticas de Machine Learning (Sem programação): Decision Tree (JASP), Linear Discriminant Classification (JASP) e Plataforma ORANGE
• Aula Bônus: Avaliação Psicológica e Machine Learning
• Aula Bônus: Livros e Cursos recomendados  
• Aula Bônus: Entrevista com Cientista de Dados focado na área da Saúde

Módulo 1: O que é Machine Learning

• O que é Machine Learning?
• Como a máquina aprende?
• Machine Learning para Psicometria e Pesquisa Quantitativa (pesquisas comentadas)
• Tipos de Machine Learning (Supervisionado e Não-supervisionado)
• Práticas de Machine Learning (Sem programação): JASP e SPSS
Aula Bônus: Filosofia da Inteligência Artificial
• Aula Bônus: Entrevista com Cientista de Dados graduado em Psicologia
• Aula bônus: Estudo de Caso sobre Redução Dimensional 

Preencha abaixo para
participar gratuitamente

Fique tranquilo, não utilizaremos suas informações de contato para enviar qualquer tipo de SPAM. Os dados coletados são tratados nos termos da Lei Geral de Proteção de Dados e você pode se descadastrar da nossa lista de contatos a qualquer momento.