Receba gratuitamente todos os nossos conteúdos.

Fique por dentro das novidades e oportunidades referentes à Psicometria e Análise Quantitativa de Dados.

Tutorial: Como fazer uma Regressão Logística

Vamos aprender a fazer uma Regressão Logística mais fácil do que no Excel usando um software 100% gratuito.

No exemplo a seguir vamos realizar uma regressão logística binária, utilizando duas variáveis independentes: prescrição de exercícios (sim/não) e níveis de estresse (alto escore = alto nível de estresse). A variável dependente é a ocorrência ou não (1 ou 0) de um segundo ataque do coração, criando assim um modelo de regressão logística. Os dados são originados do banco de dados do JASP, você pode baixar clicando aqui e faz parte do livro (manual) do JASP, o qual você também pode fazer o download na própria página do JASP.

Abra o banco de dados Heart Attack.csv no Jasp. Ele contém 4 colunas de dados, a variável ID do paciente, a variável 2nd heart attack – eles tiveram um segundo ataque cardíaco (sim/não), Exercise prescription – se foram prescritos exercícios (sim/não) e Stress level – seus níveis de estresse (alto valor = alto tensão).
Vá no módulo Regressão e escolha Regressão Logística. Coloque a variável de resultado (2nd heart attack) na variável dependente, adicione os níveis de estresse (Stress level) às covariáveis e prescrição de exercícios (Exercise prescription) a fatores. Deixe o método de entrada de dados como enter.

Perceba que o JASP, de modo automático, já exibe o output. Porém, vamos clicar em Estatísticas. Nas opções de estatísticas, vamos selecionar estimativas, odds ratios, matriz de confusão, sensibilidade e especificidade.

Vamos agora entender o output. A primeira tabela é o resumo do modelo.

O resumo do modelo mostra que o H1 (com as menores escores AIC e BIC) sugere uma relação significativa (x2 (37) = 21.257, p <0,001) entre o resultado (2º ataque cardíaco) e as variáveis preditores (prescrição de exercícios e níveis de estresse ). R2 de McFadden = 0,383. Sugere -se que um intervalo de 0,2 a 0,4 indique um bom ajuste do modelo.

Agora vamos interpretar a tabela dos coeficientes.

Tanto o nível de estresse quanto a prescrição do exercício são variáveis preditivas significativas (p = 0,031 e 0,022, respectivamente). Os valores mais importantes na tabela de coeficientes são os odds ratios. Para o preditor contínuo, uma razão de chances superior a 1 sugere uma relação positiva, enquanto <1 implica uma relação negativa.

Isso sugere que os níveis de alto estresse estão significativamente relacionados a uma maior probabilidade de ter um segundo ataque cardíaco. Ter uma intervenção do exercício está relacionado a uma probabilidade significativamente reduzida de um segundo ataque cardíaco. O odds ratio de 0,13 pode ser interpretado como tendo apenas 13% de probabilidade de um segundo ataque cardíaco se estiver submetido a uma intervenção do exercício.

Na sequência, podemos analisar a matriz de confusão, isto é, vamos fazer um diagnostico de performance da nossa regressão logística.

A matriz de confusão mostra onde a concordância (sim/sim) ou desacordo (sim/não) ocorreu entre os previstos e observados que os 15 casos negativos e positivos verdadeiros foram previstos pelo modelo enquanto o erro, falsos negativos e positivos, foram encontrados em 5 casos. Isso é confirmado nas métricas de desempenho em que tanto a sensibilidade (% dos casos que tiveram o resultado corretamente previam) e a especificidade (% dos casos corretamente previstos como não ter o resultado (ou seja, negativos verdadeiros) são 75%.

Como reportar os resultados de uma Regressão Logística?

A regressão logística foi realizada para verificar os efeitos do estresse e da intervenção do exercício na probabilidade de os participantes terem um segundo ataque cardíaco. O modelo de regressão logística foi estatisticamente significativo, χ2 (37) = 21.257, p <0,001. O modelo classificou corretamente 75,0% dos casos. O estresse crescente foi associado a uma probabilidade aumentada de um 2º ataque cardíaco, mas o estresse decrescente foi associado a uma redução na probabilidade. A presença de um programa de intervenção do exercício reduziu a probabilidade de um segundo ataque cardíaco para 13%.

Esperamos que tenha ficado claro como realizar uma regressão logística.

Gostou desse conteúdo? Precisa aprender Análise de dados? Faça parte da Psicometria Online Academy: a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).

BRUNO FIGUEIREDO DAMÁSIO

Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) eEditor-Associado da Spanish Journal of Psychology, na sub-seção Psicometri e Métodos Quantitativos.

Tenho mais de 50 artigos publicados e mais de 3000 citações, nas melhores revistas nacionais e internacionais. Atualmente, me dedico a formação de novos pesquisadores, através da Psicometria Online Academy. Minha missão é ampliar a formação em Psicometria no Brasil e lhe auxiliar a conquistar os seus objetivos profissionais.

Deseja se tornar completamente autônomo e independente na análise dos seus dados?

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Veja mais

Posts relacionados

Um Guia Completo sobre a PEDro: Physiotherapy Evidence Database

Um Guia Completo sobre a PEDro: Physiotherapy Evidence Database

Se você é um profissional ou um estudante da área da saúde e está interessado nas práticas baseadas em evidências, este post é para você. Vamos descobrir como a base

Diferença entre as regressões logísticas: binária, ordinal e multinomial

Diferença entre as regressões logísticas: binária, ordinal e multinomial

A análise de regressão é uma técnica amplamente utilizada para verificar a existência de uma relação entre uma variável dependente e uma ou mais variáveis independentes. Existem diferentes tipos de

Construção de itens para instrumentos de autorrelato

Construção de itens para instrumentos de autorrelato

A elaboração de itens para instrumentos de autorrelato desempenha um papel crucial na pesquisa psicométrica, pois é por meio deles que os participantes expressam suas próprias experiências e percepções. Neste

Dados Normativos: Entendendo o Escore Z

Dados Normativos: Entendendo o Escore Z

Interpretar os resultados derivados do uso de um teste é tão crucial quanto criar ou adaptar os instrumentos e aplicá-los corretamente. Para a interpretação dos resultados, é essencial a criação

Compreendendo a Confiabilidade Duas-Metades (Split-Half Reliabity)

Compreendendo a Confiabilidade Duas-Metades (Split-Half Reliabity)

No campo da Psicometria, pesquisadores e profissionais frequentemente buscam garantir a precisão e consistência de seus instrumentos de medição. Um dos métodos usados para avaliar a confiabilidade de um teste

Um Guia Completo sobre a PEDro: Physiotherapy Evidence Database

Um Guia Completo sobre a PEDro: Physiotherapy Evidence Database

Se você é um profissional ou um estudante da área da saúde e está interessado nas práticas baseadas em evidências, este post é para você. Vamos descobrir como a base

Diferença entre as regressões logísticas: binária, ordinal e multinomial

Diferença entre as regressões logísticas: binária, ordinal e multinomial

A análise de regressão é uma técnica amplamente utilizada para verificar a existência de uma relação entre uma variável dependente e uma ou mais variáveis independentes. Existem diferentes tipos de

Construção de itens para instrumentos de autorrelato

Construção de itens para instrumentos de autorrelato

A elaboração de itens para instrumentos de autorrelato desempenha um papel crucial na pesquisa psicométrica, pois é por meio deles que os participantes expressam suas próprias experiências e percepções. Neste

Dados Normativos: Entendendo o Escore Z

Dados Normativos: Entendendo o Escore Z

Interpretar os resultados derivados do uso de um teste é tão crucial quanto criar ou adaptar os instrumentos e aplicá-los corretamente. Para a interpretação dos resultados, é essencial a criação

Compreendendo a Confiabilidade Duas-Metades (Split-Half Reliabity)

Compreendendo a Confiabilidade Duas-Metades (Split-Half Reliabity)

No campo da Psicometria, pesquisadores e profissionais frequentemente buscam garantir a precisão e consistência de seus instrumentos de medição. Um dos métodos usados para avaliar a confiabilidade de um teste

Cadastre-se para ser notificado com o link das aulas ao vivo:

Módulo 4: Redes neurais artificiais

• Introdução a Deep Learning

• Avaliando sistemas de Deep Learning

• Redes Neurais feitas (sem programação) no SPSS

• Aula bônus: O futuro da IA na Sociedade

• Aula bônus: Dois Estudos de Caso 

Módulo 3: Interpretar e reportar resultados

• Gerar, interpretar e reportar resultados em Machine Learning

Módulo 2: Criando o seu sistema

• Selecionando algoritmos e métodos 
• Práticas de Machine Learning (Sem programação): Decision Tree (JASP), Linear Discriminant Classification (JASP) e Plataforma ORANGE
• Aula Bônus: Avaliação Psicológica e Machine Learning
• Aula Bônus: Livros e Cursos recomendados  
• Aula Bônus: Entrevista com Cientista de Dados focado na área da Saúde

Módulo 1: O que é Machine Learning

• O que é Machine Learning?
• Como a máquina aprende?
• Machine Learning para Psicometria e Pesquisa Quantitativa (pesquisas comentadas)
• Tipos de Machine Learning (Supervisionado e Não-supervisionado)
• Práticas de Machine Learning (Sem programação): JASP e SPSS
Aula Bônus: Filosofia da Inteligência Artificial
• Aula Bônus: Entrevista com Cientista de Dados graduado em Psicologia
• Aula bônus: Estudo de Caso sobre Redução Dimensional 

Preencha abaixo para
participar gratuitamente

Fique tranquilo, não utilizaremos suas informações de contato para enviar qualquer tipo de SPAM. Os dados coletados são tratados nos termos da Lei Geral de Proteção de Dados e você pode se descadastrar da nossa lista de contatos a qualquer momento.