Receba gratuitamente todos os nossos conteúdos.

Fique por dentro das novidades e oportunidades referentes à Psicometria e Análise Quantitativa de Dados.

Diferença entre as regressões logísticas: binária, ordinal e multinomial

A análise de regressão é uma técnica amplamente utilizada para verificar a existência de uma relação entre uma variável dependente e uma ou mais variáveis independentes.

Existem diferentes tipos de regressão, cada um adequado para diferentes tipos de variáveis dependentes. Neste post, exploraremos as nuances entre os três tipos de regressão logística: binária, ordinal e multinomial.

Quando usar regressão logística?

Antes de mergulharmos nos diferentes tipos de regressão logística, é importante entender o que é essa técnica e como ela funciona. A regressão logística é aplicada quando a variável dependente é categórica ou binária.

Ela é usada para modelar a probabilidade de ocorrência de um evento, com base em uma ou mais variáveis independentes.

De forma simples, a diferença entre a regressão linear e a logística é que, enquanto a regressão linear prevê um valor numérico, a regressão logística estima a probabilidade de ocorrência de uma categoria ou evento.

Qual é o objetivo da regressão logística binária?

A regressão logística binária é o tipo mais comum de regressão logística. É utilizada quando a variável dependente tem apenas duas categorias possíveis, como “sim” ou “não”, “sucesso” ou “fracasso”.

Por exemplo, podemos usar a regressão logística binária para prever se um estudante será aprovado ou reprovado em um exame com base em suas horas de estudo.

Nesse tipo de regressão, a variável resposta é transformada em uma probabilidade de ocorrência do evento de interesse.

Suposições da Regressão logística Binária:

-A variável dependente deve ser dicotômica.

-As variáveis independentes podem ser de qualquer tipo: nominal, ordinal, intervalar ou de razão.

– As observações devem ser independentes umas das outras.

– Não deve haver multicolinearidade, ou seja, as variáveis independentes não devem ser altamente correlacionadas entre si.

Exemplos:

Previsão de aprovação de crédito (aprovado/não aprovado): Neste contexto, uma instituição financeira deseja prever se um empréstimo deve ser aprovado ou não com base em diversas características do solicitante.

A variável dependente é, portanto, binária (aprovado/não aprovado), e as variáveis independentes são aquelas que a instituição acredita que estão relacionadas com a capacidade do solicitante de reembolsar o empréstimo (exemplos: renda, histórico de dívidas, etc.)

Diagnóstico médico (doença presente/ausente): O uso da regressão logística binária no diagnóstico médico é outro exemplo prático que ilustra bem a capacidade desta técnica de modelar eventos binários – neste caso, a presença ou ausência de uma doença.

Na prática médica, um modelo de regressão logística pode ajudar a identificar a probabilidade de um paciente ter uma doença com base em um conjunto de variáveis independentes (exemplos: sexo, pressão arterial, tabagismo, etc).

Qual é o objetivo da regressão logística ordinal?

A regressão logística ordinal é utilizada quando a variável resposta é categórica ordinal, ou seja, possui três ou mais categorias que têm uma ordem natural.

Por exemplo, podemos usar a regressão logística ordinal para prever a satisfação dos clientes em uma escala de “muito insatisfeito” a “muito satisfeito” com base em suas características demográficas.

Ao executar a regressão logística ordinal, será levado em conta esta ordem e teremos as informações de contribuição de cada variável independente.

Suposições da Regressão logística Ordinal:

-A variável dependente é ordinal.

-As variáveis independentes podem ser contínuas ou categóricas.

Exemplos:

Avaliação de satisfação de clientes (muito insatisfeito, insatisfeito, neutro, satisfeito, muito satisfeito): Ao realizar uma regressão logística ordinal, o modelo pode mostrar que clientes que relatam tempos de espera curtos e alta qualidade no atendimento têm uma alta probabilidade de estar na categoria “Muito satisfeito”.

Classificação de dor em pacientes (sem dor, dor leve, dor moderada, dor intensa): Neste cenário, os diferentes níveis de dor são ordenados de menos para mais intensos. Ao utilizar a regressão logística ordinal, na prática, se a probabilidade de “dor intensa” for significativamente mais alta, a equipe médica pode decidir intensificar as medidas preventivas de controle de dor para esse paciente.

Qual é o objetivo da regressão logística multinomial?

A regressão logística multinomial é utilizada quando a variável resposta é categórica nominal, ou seja, possui três ou mais categorias que não têm uma ordem natural.

Por exemplo, podemos usar a regressão logística multinomial para prever a preferência de compra de um produto entre três ou mais marcas diferentes com base nas características dos consumidores.

Suposições da Regressão logística Multinomial:

-A variável dependente é nominal com mais de duas categorias.

– É importante garantir a independência das observações.

-Não há relação de ordem entre as categorias da variável dependente.

-A multicolinearidade deve ser evitada.

Exemplos:

Previsão de qual partido político um eleitor irá escolher (Partido A, Partido B, Partido C): Ao aplicar a regressão logística multinomial, a organização pode estimar as probabilidades de um eleitor votar no Partido A, Partido B ou Partido C, com base nas em variáveis independentes como sexo, idade, nível educacional, entre outras.

Decisão de compra de consumidores (compra produto A, produto B, ou nenhum): Neste caso, imagine o seguinte contexto: Uma empresa de bebidas está lançando dois novos sabores de sucos, Produto A e Produto B, e quer prever qual deles terá mais sucesso ou se os consumidores preferirão não comprar nenhum dos dois.

Ao aplicar regressão logística multinomial, os resultados do modelo podem indicar que os consumidores com maior renda têm maior probabilidade de comprar o Produto A e que jovens entre 20 e 30 anos de idade podem ser mais inclinados a comprar o Produto B.

Comparação entre os tipos de regressão logística

A principal diferença entre os tipos de regressão logística está no número de categorias da variável resposta e na ordem ou falta de ordem entre essas categorias.

A regressão logística binária é utilizada quando há apenas duas categorias, a regressão logística ordinal é utilizada quando há três ou mais categorias com uma ordem natural, e a regressão logística multinomial é utilizada quando há três ou mais categorias sem uma ordem natural.

Conclusão

Em resumo, a regressão logística é uma metodologia estatística robusta e versátil que permite aos analistas de dados e pesquisadores examinar e prever o impacto de uma ou mais variáveis independentes sobre uma variável dependente categórica.

Dependendo da natureza dos dados, podemos escolher entre a regressão logística binária, ordinal ou multinomial, cada uma adequada a diferentes cenários e tipos de variáveis dependentes.

A regressão logística binária é ideal para situações com duas categorias mutuamente exclusivas, a ordinal lida eficientemente com categorias que têm uma ordem natural, enquanto a multinomial aborda cenários com três ou mais categorias desprovidas de uma ordenação específica.

Para aqueles que desejam conhecer mais sobre essas técnicas de análise de dados, existem outras postagens no blog, desde a diferença entre regressão logística e linear, métodos de seleção de variáveis independentes até um tutorial de como executar a regressão logística. Essas postagens podem servir como guias que facilitam a implementação desses modelos.

Esperamos que este post tenha ajudado você a entender melhor esses conceitos e como aplicá-los na prática.

Aproveite e inscreva-se no canal e aprimore suas habilidades em análise de dados!

Gostou desse conteúdo? Precisa aprender Análise de dados? Faça parte da Psicometria Online Academy: a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).

BRUNO FIGUEIREDO DAMÁSIO

Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) eEditor-Associado da Spanish Journal of Psychology, na sub-seção Psicometri e Métodos Quantitativos.

Tenho mais de 50 artigos publicados e mais de 3000 citações, nas melhores revistas nacionais e internacionais. Atualmente, me dedico a formação de novos pesquisadores, através da Psicometria Online Academy. Minha missão é ampliar a formação em Psicometria no Brasil e lhe auxiliar a conquistar os seus objetivos profissionais.

Deseja se tornar completamente autônomo e independente na análise dos seus dados?

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Veja mais

Posts relacionados

Um Guia Completo sobre a PEDro: Physiotherapy Evidence Database

Um Guia Completo sobre a PEDro: Physiotherapy Evidence Database

Se você é um profissional ou um estudante da área da saúde e está interessado nas práticas baseadas em evidências, este post é para você. Vamos descobrir como a base

Diferença entre as regressões logísticas: binária, ordinal e multinomial

Diferença entre as regressões logísticas: binária, ordinal e multinomial

A análise de regressão é uma técnica amplamente utilizada para verificar a existência de uma relação entre uma variável dependente e uma ou mais variáveis independentes. Existem diferentes tipos de

Construção de itens para instrumentos de autorrelato

Construção de itens para instrumentos de autorrelato

A elaboração de itens para instrumentos de autorrelato desempenha um papel crucial na pesquisa psicométrica, pois é por meio deles que os participantes expressam suas próprias experiências e percepções. Neste

Dados Normativos: Entendendo o Escore Z

Dados Normativos: Entendendo o Escore Z

Interpretar os resultados derivados do uso de um teste é tão crucial quanto criar ou adaptar os instrumentos e aplicá-los corretamente. Para a interpretação dos resultados, é essencial a criação

Compreendendo a Confiabilidade Duas-Metades (Split-Half Reliabity)

Compreendendo a Confiabilidade Duas-Metades (Split-Half Reliabity)

No campo da Psicometria, pesquisadores e profissionais frequentemente buscam garantir a precisão e consistência de seus instrumentos de medição. Um dos métodos usados para avaliar a confiabilidade de um teste

Um Guia Completo sobre a PEDro: Physiotherapy Evidence Database

Um Guia Completo sobre a PEDro: Physiotherapy Evidence Database

Se você é um profissional ou um estudante da área da saúde e está interessado nas práticas baseadas em evidências, este post é para você. Vamos descobrir como a base

Diferença entre as regressões logísticas: binária, ordinal e multinomial

Diferença entre as regressões logísticas: binária, ordinal e multinomial

A análise de regressão é uma técnica amplamente utilizada para verificar a existência de uma relação entre uma variável dependente e uma ou mais variáveis independentes. Existem diferentes tipos de

Construção de itens para instrumentos de autorrelato

Construção de itens para instrumentos de autorrelato

A elaboração de itens para instrumentos de autorrelato desempenha um papel crucial na pesquisa psicométrica, pois é por meio deles que os participantes expressam suas próprias experiências e percepções. Neste

Dados Normativos: Entendendo o Escore Z

Dados Normativos: Entendendo o Escore Z

Interpretar os resultados derivados do uso de um teste é tão crucial quanto criar ou adaptar os instrumentos e aplicá-los corretamente. Para a interpretação dos resultados, é essencial a criação

Compreendendo a Confiabilidade Duas-Metades (Split-Half Reliabity)

Compreendendo a Confiabilidade Duas-Metades (Split-Half Reliabity)

No campo da Psicometria, pesquisadores e profissionais frequentemente buscam garantir a precisão e consistência de seus instrumentos de medição. Um dos métodos usados para avaliar a confiabilidade de um teste

Cadastre-se para ser notificado com o link das aulas ao vivo:

Módulo 4: Redes neurais artificiais

• Introdução a Deep Learning

• Avaliando sistemas de Deep Learning

• Redes Neurais feitas (sem programação) no SPSS

• Aula bônus: O futuro da IA na Sociedade

• Aula bônus: Dois Estudos de Caso 

Módulo 3: Interpretar e reportar resultados

• Gerar, interpretar e reportar resultados em Machine Learning

Módulo 2: Criando o seu sistema

• Selecionando algoritmos e métodos 
• Práticas de Machine Learning (Sem programação): Decision Tree (JASP), Linear Discriminant Classification (JASP) e Plataforma ORANGE
• Aula Bônus: Avaliação Psicológica e Machine Learning
• Aula Bônus: Livros e Cursos recomendados  
• Aula Bônus: Entrevista com Cientista de Dados focado na área da Saúde

Módulo 1: O que é Machine Learning

• O que é Machine Learning?
• Como a máquina aprende?
• Machine Learning para Psicometria e Pesquisa Quantitativa (pesquisas comentadas)
• Tipos de Machine Learning (Supervisionado e Não-supervisionado)
• Práticas de Machine Learning (Sem programação): JASP e SPSS
Aula Bônus: Filosofia da Inteligência Artificial
• Aula Bônus: Entrevista com Cientista de Dados graduado em Psicologia
• Aula bônus: Estudo de Caso sobre Redução Dimensional 

Preencha abaixo para
participar gratuitamente

Fique tranquilo, não utilizaremos suas informações de contato para enviar qualquer tipo de SPAM. Os dados coletados são tratados nos termos da Lei Geral de Proteção de Dados e você pode se descadastrar da nossa lista de contatos a qualquer momento.