O que é Multicolinearidade, como identificar e como lidar?

A multicolinearidade é uma situação em que duas ou mais variáveis independentes em um modelo de regressão encontram-se altamente correlacionadas. Essa alta correlação pode afetar a qualidade dos resultados do modelo e dificultar a interpretação dos resultados. Por exemplo, imagine que você queira estimar o efeito da escolaridade e renda na satisfação com a vida. […]

O que é covariância?

A Covariância é uma medida da relação linear entre duas variáveis. Nós também podemos dizer que é a medida de dependência entre duas variáveis. Dito de outra maneira, a covariância mede o quanto uma variável muda, quando outra variável muda. Por exemplo, vamos considerar as variáveis “idade” e “salário”. É esperado que conforme a idade […]

O que é Correlação Policórica?

A correlação policórica é usada quando queremos analisar a relação entre duas variáveis categóricas ordinais. Para isso, ela assume que o valor das categorias é derivado uma distribuição normal. Este tipo de correlação é muito importante para a psicometria, pois é ela que usamos para correlacionar dados de uma escala do tipo Likert. O que […]

O que é Correlação Tetracórica?

A correlação tetracórica pode ser usada quando queremos analisar a correlação entre duas variáveis dicotômicas. Esta medida é uma derivação da correlação policórica. Então, assim como a policórica, ela assume que as variáveis são variáveis contínuas, mas que foram medidas de maneira binária. Por exemplo, podemos ter uma escala que avalia a depressão. Na escala, […]

O que é o coeficiente phi?

O coeficiente phi (ou φ) é uma maneira de medir a associação entre duas variáveis dicotômicas. O phi surgiu como uma maneira de medir variáveis que sejam originalmente binárias. Isso aconteceu pois era necessário uma alternativa à correlação tetracórica. A correlação tetracórica também mede a correlação entre variáveis binárias. No entanto, ela assume que a […]

Homocedasticidade na Regressão Linear

Um dos pressupostos da regressão linear múltipla é que a variância da variável dependente, Y, deve ser constante para os valores das variáveis preditoras X1, X2, …, Xn.  Outra maneira de pensar o mesmo fenômeno é que os erros do modelo (resíduos) devem ser constantes, independente dos valores da variável de resultado (Y). Esse fenômeno […]

O que é Regressão Linear Múltipla?

A Regressão Linear Múltipla é um modelo de análise que usamos quando modelamos a relação linear entre uma variável de desfecho contínua e múltiplas variáveis preditoras que podem ser contínuas ou categóricas. A principal diferença entre a Regressão Linear Múltipla e a Simples, é que na simples só usamos uma variável preditora. Você pode aprender […]

O que é Regressão de Poisson?

A regressão de Poisson é usada quando queremos projetar o valor de uma variável de resultado calculada à partir de dados de contagem ou tabelas de contingências. Estas variáveis contabilizadas através da contagem de elementos. Já as variáveis preditoras podem ser de qualquer tipo (contínuas, binárias, categóricas, etc.). No exemplo seguinte as variáveis de contagem […]

O que é Regressão Linear?

Regressão Linear é um conjunto de técnicas que se baseiam em uma ideia comum: estimar o valor de uma variável Y através dos valores de uma ou mais variáves Xn. Dito de outra forma, isso significa poder prever o valor de uma variável através de outras variáveis. A variável predita pode ser chamada de “variável […]

O que é Correlação tau de Kendall?

O Coeficiente de Correlação de Kendall (representado pela letra grega τ – tau), é uma medida não-paramétrica que avalia a associação entre duas variáveis. É semelhante à correlação de Spearman, pois ambas utilizam os postos das variáveis, e não os seus escores reais. Por ser um teste não-paramétrico, a correlação de Kendall pode ser usada […]

O que é Correlação de Spearman?

O Coeficiente de Correlação por Postos de Spearman, é uma medida não paramétrica da dependência dos postos das variáveis. Este coeficiente também pode ser chamado de ρ (rho) de Spearman, rs de Spearman ou Correlação de Spearman. Como o nome já dá a entender, a correlação de Spearman descreve a relação entre as variáveis através […]

O que é Regressão Logística?

A Regressão Logísitica é um método usado para prever uma variável de resultado que seja categórica a partir de variáveis preditoras categóricas ou contínuas. As variáveis de resultado também costumam ser chamadas de dependentes e as preditoras de independentes. O processo de prever uma categoria específica pode ser chamado de classificação. As variáveis de resultado […]

O que é Correlação de Pearson

O Coeficiente de Correlação de Pearson é uma técnica para medir se duas variáveis estão relacionadas de maneira linear. Esta técnica também pode ser chamada de r de Pearson, Correlação Produto-Momento de Pearson ou mais coloquialmente de correlação de Pearson. O que a relação linear entre variáveis? A relação linear entre duas variáveis significa que […]