Receba gratuitamente todos os nossos conteúdos.

Fique por dentro das novidades e oportunidades referentes à Psicometria e Análise Quantitativa de Dados.

Os métodos de seleção de variáveis Forward e Backward na regressão linear múltipla

Os métodos de seleção de variáveis são úteis quando realizamos uma regressão múltipla e nos deparamos com a questão de quais variáveis preditoras são importantes, dentre um conjunto maior de possíveis preditores. Essa tarefa consiste em identificar quais variáveis são importantes entre um conjunto maior de possíveis preditores. Uma maneira de fazer isso é através da utilização dos valores-p individuais para refazer manualmente o modelo com apenas as variáveis preditoras significativas, mas isso pode ser desafiador.

Para ajudar nessa tarefa, existem dois métodos automatizados de seleção de variáveis preditoras, conhecidos como métodos de seleção passo a passo. Esses métodos facilitam a seleção de variáveis significativas para o modelo testado e podem ser facilmente encontrados em softwares estatísticos, como o SPSS.

Neste post apresentamos dois métodos automatizados de seleção de variáveis preditoras para modelos de regressão múltipla. Esses métodos são chamados de métodos de seleção passo a passo (stepwise selection) e são amplamente disponíveis em softwares estatísticos como o SPSS. Eles ajudam a identificar as variáveis mais relevantes para o modelo testado, tornando a seleção de variáveis preditoras mais intuitiva.

Método Forward (ou forward selection)

No método Forward de seleção de variáveis para modelos de regressão, o processo começa com a escolha de um conjunto de possíveis variáveis preditoras. E ao executar a análise, em vez de começar com todas as variáveis no modelo, o processo começa com um “modelo vazio”, também conhecido como Modelo Nulo. A partir daí, as variáveis preditoras são adicionadas automaticamente ao modelo, uma por vez, começando com aquela que tem o menor valor-p. Esse processo continua até que todas as variáveis preditoras selecionadas tenham sido testadas e aquelas que não atingirem um limite pré-definido de valor-p (geralmente p acima de 0,05) sejam excluídas do modelo.

Método Backward (or backward elimination)

Outra alternativa de método passo a passo é a seleção Backward. Esse método começa com um modelo completo que inclui todas as variáveis consideradas (conhecido como Modelo Completo). Em seguida, uma a uma, as variáveis menos significativas são removidas, começando com aquela que tem o maior valor-p. Esse processo continua até que reste apenas as variáveis mais significativas para o modelo, ou até que nenhuma variável seja deixada no modelo.

Por que utilizar métodos de seleção passo a passo?

A seleção passo a passo fornece uma maneira reprodutível e objetiva de reduzir o número de preditores em comparação com a escolha manual de variáveis com base na opinião de especialistas que, com mais frequência do que gostaríamos de admitir, tende a provar a própria hipótese.

Porém, é importante destacar que a seleção automatizada de variáveis não deve substituir completamente o conhecimento prévio dos especialistas. Na verdade, variáveis consideradas importantes com base no conhecimento prévio devem ser incluídas no modelo e testadas.

Por outro lado, a seleção automatizada de variáveis pode ser muito útil na análise exploratória de dados, especialmente em casos em que há poucas evidências empíricas anteriores sobre as relações entre as variáveis investigadas, ou seja, quando o conhecimento prévio não está disponível. Nesses casos, a seleção automatizada de variáveis pode ajudar a identificar padrões ou relações inesperadas entre as variáveis, o que pode levar a novas hipóteses e descobertas interessantes.

Aproveite que você está por aqui e visite nossos posts sobre regressão linear simples e o poder preditivo da regressão linear.

Gostou desse conteúdo? Precisa aprender Análise de dados? Faça parte da Psicometria Online Academy: a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).

BRUNO FIGUEIREDO DAMÁSIO

Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) eEditor-Associado da Spanish Journal of Psychology, na sub-seção Psicometri e Métodos Quantitativos.

Tenho mais de 50 artigos publicados e mais de 3000 citações, nas melhores revistas nacionais e internacionais. Atualmente, me dedico a formação de novos pesquisadores, através da Psicometria Online Academy. Minha missão é ampliar a formação em Psicometria no Brasil e lhe auxiliar a conquistar os seus objetivos profissionais.

Deseja se tornar completamente autônomo e independente na análise dos seus dados?

Uma resposta

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Veja mais

Posts relacionados

Um Guia Completo sobre a PEDro: Physiotherapy Evidence Database

Um Guia Completo sobre a PEDro: Physiotherapy Evidence Database

Se você é um profissional ou um estudante da área da saúde e está interessado nas práticas baseadas em evidências, este post é para você. Vamos descobrir como a base

Diferença entre as regressões logísticas: binária, ordinal e multinomial

Diferença entre as regressões logísticas: binária, ordinal e multinomial

A análise de regressão é uma técnica amplamente utilizada para verificar a existência de uma relação entre uma variável dependente e uma ou mais variáveis independentes. Existem diferentes tipos de

Construção de itens para instrumentos de autorrelato

Construção de itens para instrumentos de autorrelato

A elaboração de itens para instrumentos de autorrelato desempenha um papel crucial na pesquisa psicométrica, pois é por meio deles que os participantes expressam suas próprias experiências e percepções. Neste

Dados Normativos: Entendendo o Escore Z

Dados Normativos: Entendendo o Escore Z

Interpretar os resultados derivados do uso de um teste é tão crucial quanto criar ou adaptar os instrumentos e aplicá-los corretamente. Para a interpretação dos resultados, é essencial a criação

Compreendendo a Confiabilidade Duas-Metades (Split-Half Reliabity)

Compreendendo a Confiabilidade Duas-Metades (Split-Half Reliabity)

No campo da Psicometria, pesquisadores e profissionais frequentemente buscam garantir a precisão e consistência de seus instrumentos de medição. Um dos métodos usados para avaliar a confiabilidade de um teste

Um Guia Completo sobre a PEDro: Physiotherapy Evidence Database

Um Guia Completo sobre a PEDro: Physiotherapy Evidence Database

Se você é um profissional ou um estudante da área da saúde e está interessado nas práticas baseadas em evidências, este post é para você. Vamos descobrir como a base

Diferença entre as regressões logísticas: binária, ordinal e multinomial

Diferença entre as regressões logísticas: binária, ordinal e multinomial

A análise de regressão é uma técnica amplamente utilizada para verificar a existência de uma relação entre uma variável dependente e uma ou mais variáveis independentes. Existem diferentes tipos de

Construção de itens para instrumentos de autorrelato

Construção de itens para instrumentos de autorrelato

A elaboração de itens para instrumentos de autorrelato desempenha um papel crucial na pesquisa psicométrica, pois é por meio deles que os participantes expressam suas próprias experiências e percepções. Neste

Dados Normativos: Entendendo o Escore Z

Dados Normativos: Entendendo o Escore Z

Interpretar os resultados derivados do uso de um teste é tão crucial quanto criar ou adaptar os instrumentos e aplicá-los corretamente. Para a interpretação dos resultados, é essencial a criação

Compreendendo a Confiabilidade Duas-Metades (Split-Half Reliabity)

Compreendendo a Confiabilidade Duas-Metades (Split-Half Reliabity)

No campo da Psicometria, pesquisadores e profissionais frequentemente buscam garantir a precisão e consistência de seus instrumentos de medição. Um dos métodos usados para avaliar a confiabilidade de um teste

Cadastre-se para ser notificado com o link das aulas ao vivo:

Módulo 4: Redes neurais artificiais

• Introdução a Deep Learning

• Avaliando sistemas de Deep Learning

• Redes Neurais feitas (sem programação) no SPSS

• Aula bônus: O futuro da IA na Sociedade

• Aula bônus: Dois Estudos de Caso 

Módulo 3: Interpretar e reportar resultados

• Gerar, interpretar e reportar resultados em Machine Learning

Módulo 2: Criando o seu sistema

• Selecionando algoritmos e métodos 
• Práticas de Machine Learning (Sem programação): Decision Tree (JASP), Linear Discriminant Classification (JASP) e Plataforma ORANGE
• Aula Bônus: Avaliação Psicológica e Machine Learning
• Aula Bônus: Livros e Cursos recomendados  
• Aula Bônus: Entrevista com Cientista de Dados focado na área da Saúde

Módulo 1: O que é Machine Learning

• O que é Machine Learning?
• Como a máquina aprende?
• Machine Learning para Psicometria e Pesquisa Quantitativa (pesquisas comentadas)
• Tipos de Machine Learning (Supervisionado e Não-supervisionado)
• Práticas de Machine Learning (Sem programação): JASP e SPSS
Aula Bônus: Filosofia da Inteligência Artificial
• Aula Bônus: Entrevista com Cientista de Dados graduado em Psicologia
• Aula bônus: Estudo de Caso sobre Redução Dimensional 

Preencha abaixo para
participar gratuitamente

Fique tranquilo, não utilizaremos suas informações de contato para enviar qualquer tipo de SPAM. Os dados coletados são tratados nos termos da Lei Geral de Proteção de Dados e você pode se descadastrar da nossa lista de contatos a qualquer momento.