Receba gratuitamente todos os nossos conteúdos.

Fique por dentro das novidades e oportunidades referentes à Psicometria e Análise Quantitativa de Dados.

O que devo saber sobre o poder preditivo da Regressão Linear

Na regressão linear usamos relações lineares entre uma variável dependente (alvo) e uma ou mais variáveis independentes (preditores) para assim explicar o desfecho. Para regressão linear, sua variável
dependente (a coisa que você está tentando explicar ou prever) precisa ser uma variável contínua.

Linear Regression vs Multiple Regression: Know the Difference - SDS Club

A regressão linear é o método comumente usado dentro de análises preditivas (arvores de decisão, machine learning, forescast,etc.), por isso que muitos pesquisadores usam o  termo analise preditiva.
Típico da literatura estatística, você encontrará diferentes autores usando termos diferentes ao descrever a regressão linear ou múltipla – muito confuso para um pesquisador experiente, quanto mais para um
iniciante na área! Talvez esse seja o maior impasse sobre o caráter preditivo da regressão.

Mas devemos ter em mente que esse poder preditivo tem limitações:
Devemos usar o modelo apenas para fazer previsões dentro do intervalo de dados usado para estimar o modelo de regressão. E também, usar o modelo apenas para fazer previsões para a população amostrada.

Vou te dar um exemplo simples mas prático:
Suponha que um médico colete dados de altura (em polegadas) e peso (em libras) em 50 pacientes. Ele então ajusta um modelo de regressão linear simples usando “peso” como variável preditora e “altura” como variável de resposta. A equação de regressão ajustada é a seguinte:
Altura = 32,7830 + 0,2001*(peso)
Depois de verificar se as suposições do modelo de regressão linear são atendidas, o médico conclui que o modelo se ajusta bem aos dados. Ele pode então usar o modelo para prever a altura de novos pacientes com base em seu peso. Por exemplo, suponha que um novo paciente pesa 170 libras. Usando o modelo, poderíamos prever que esse paciente teria uma altura de 66,8 polegadas:
Altura = 32,7830 + 0,2001*(170) = 66,8 polegadas

Agora sobre ter cuidado com a predição:

Por exemplo, suponha que ajustamos um modelo de regressão usando a variável preditora “peso” e o peso dos indivíduos na amostra que usamos para estimar que o modelo variou entre 120 libras e 180 libras. Seria inválido usar o modelo para estimar a altura de um indivíduo que pesava 200 libras porque isso está fora do intervalo da variável preditora que usamos para estimar o modelo. É possível que a relação entre peso e altura seja diferente fora da faixa de 120 a 180 libras, portanto, não devemos usar o modelo para estimar a altura de um indivíduo que pesa 200 libras.

De maneira geral, a regressão linear pode ser usada para abordar uma variedade de questões de pesquisa. Ele pode dizer o quão bem um conjunto de variáveis ​​é capaz de explicar um resultado específico. Por exemplo, você pode estar interessado em explorar quão bem um conjunto de subescalas em um teste de inteligência é capaz de prever o desempenho em uma tarefa específica, lembrando do que falei ali em cima. A regressão linear também fornecerá informações sobre o modelo como um todo (todas as subescalas) e a contribuição relativa de cada uma das variáveis ​​que compõem o modelo (subescalas individuais). Como extensão disso, a regressão linear permitirá testar se a adição de uma variável (por exemplo, motivação) contribui para a capacidade explicativa do modelo, além das variáveis ​​já incluídas no modelo.

Se por um lado, na regressão linear, exploramos uma técnica para avaliar o impacto de um conjunto de preditores em uma variável dependente, por outro existem muitas situações de pesquisa em que variável dependente de interesse é categórica (por exemplo, ganhar/perder; falhar/passar; morto/vivo; doente/não doente). Por outro lado, a regressão linear não é adequada quando você tem variáveis ​​dependentes categóricas, sendo mais adequado nesses casos a regressão logística binária (para variáveis categóricas dicotômicas) ou a regressão logística multinominal/polinomial (para variáveis categóricas politõmicas – com mais de duas categorias).

Espero que esse post tenha sido útil!

Gostou desse conteúdo? Precisa aprender Análise de dados? Faça parte da Psicometria Online Academy: a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).

BRUNO FIGUEIREDO DAMÁSIO

Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) eEditor-Associado da Spanish Journal of Psychology, na sub-seção Psicometri e Métodos Quantitativos.

Tenho mais de 50 artigos publicados e mais de 3000 citações, nas melhores revistas nacionais e internacionais. Atualmente, me dedico a formação de novos pesquisadores, através da Psicometria Online Academy. Minha missão é ampliar a formação em Psicometria no Brasil e lhe auxiliar a conquistar os seus objetivos profissionais.

Deseja se tornar completamente autônomo e independente na análise dos seus dados?

Uma resposta

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Veja mais

Posts relacionados

Covariância e correlação

Covariância e correlação

Se você é estudante, professor ou pesquisador você está no lugar certo. Hoje, vamos mergulhar em um conceito fundamental: covariância e correlação. Na análise de dados, entender a relação entre

Diferenças entre Modelos Lineares e Modelos Lineares Generalizados (GLMs)

Diferenças entre Modelos Lineares e Modelos Lineares Generalizados (GLMs)

Em análise de dados, Modelos Lineares (LMs) e Modelos Lineares Generalizados (GLMs) são duas técnicas fundamentais que desempenham papéis cruciais na modelagem e interpretação de dados. Embora ambos compartilhem o

Explorando as etapas da análise de dados

Explorando as etapas da análise de dados

No vasto universo da análise de dados, encontramos duas vertentes cruciais: as estatísticas descritivas e as estatísticas inferenciais. Cada uma desempenha um papel distintivo na interpretação e compreensão de conjuntos

Breve check list para escrita de artigo acadêmico

Breve check list para escrita de artigo acadêmico

Você está pronto para embarcar em uma jornada de descoberta acadêmica? Seja você um pesquisado experiente ou iniciante, ter um guia para escrever um artigo de pesquisa é essencial para

O que são médias marginais?

O que são médias marginais?

Ao começar com estatísticas descritivas tradicionais, como as médias brutas, reconhecemos a necessidade de ir além, considerando possíveis viéses decorrentes de variações no número de observações e covariâncias. A pergunta-chave

Covariância e correlação

Covariância e correlação

Se você é estudante, professor ou pesquisador você está no lugar certo. Hoje, vamos mergulhar em um conceito fundamental: covariância e correlação. Na análise de dados, entender a relação entre

Diferenças entre Modelos Lineares e Modelos Lineares Generalizados (GLMs)

Diferenças entre Modelos Lineares e Modelos Lineares Generalizados (GLMs)

Em análise de dados, Modelos Lineares (LMs) e Modelos Lineares Generalizados (GLMs) são duas técnicas fundamentais que desempenham papéis cruciais na modelagem e interpretação de dados. Embora ambos compartilhem o

Explorando as etapas da análise de dados

Explorando as etapas da análise de dados

No vasto universo da análise de dados, encontramos duas vertentes cruciais: as estatísticas descritivas e as estatísticas inferenciais. Cada uma desempenha um papel distintivo na interpretação e compreensão de conjuntos

Breve check list para escrita de artigo acadêmico

Breve check list para escrita de artigo acadêmico

Você está pronto para embarcar em uma jornada de descoberta acadêmica? Seja você um pesquisado experiente ou iniciante, ter um guia para escrever um artigo de pesquisa é essencial para

O que são médias marginais?

O que são médias marginais?

Ao começar com estatísticas descritivas tradicionais, como as médias brutas, reconhecemos a necessidade de ir além, considerando possíveis viéses decorrentes de variações no número de observações e covariâncias. A pergunta-chave

Cadastre-se para ser notificado com o link das aulas ao vivo:

Módulo 4: Redes neurais artificiais

• Introdução a Deep Learning

• Avaliando sistemas de Deep Learning

• Redes Neurais feitas (sem programação) no SPSS

• Aula bônus: O futuro da IA na Sociedade

• Aula bônus: Dois Estudos de Caso 

Módulo 3: Interpretar e reportar resultados

• Gerar, interpretar e reportar resultados em Machine Learning

Módulo 2: Criando o seu sistema

• Selecionando algoritmos e métodos 
• Práticas de Machine Learning (Sem programação): Decision Tree (JASP), Linear Discriminant Classification (JASP) e Plataforma ORANGE
• Aula Bônus: Avaliação Psicológica e Machine Learning
• Aula Bônus: Livros e Cursos recomendados  
• Aula Bônus: Entrevista com Cientista de Dados focado na área da Saúde

Módulo 1: O que é Machine Learning

• O que é Machine Learning?
• Como a máquina aprende?
• Machine Learning para Psicometria e Pesquisa Quantitativa (pesquisas comentadas)
• Tipos de Machine Learning (Supervisionado e Não-supervisionado)
• Práticas de Machine Learning (Sem programação): JASP e SPSS
Aula Bônus: Filosofia da Inteligência Artificial
• Aula Bônus: Entrevista com Cientista de Dados graduado em Psicologia
• Aula bônus: Estudo de Caso sobre Redução Dimensional 

Preencha abaixo para
participar gratuitamente

Fique tranquilo, não utilizaremos suas informações de contato para enviar qualquer tipo de SPAM. Os dados coletados são tratados nos termos da Lei Geral de Proteção de Dados e você pode se descadastrar da nossa lista de contatos a qualquer momento.