Receba gratuitamente todos os nossos conteúdos.

Fique por dentro das novidades e oportunidades referentes à Psicometria e Análise Quantitativa de Dados.

O que é Análise Fatorial Exploratória?

A Análise Fatorial Exploratória (AFE) é um conjunto de técnicas multivariadas que tem como objetivo encontrar a estrutura subjacente em uma matriz de dados e determinar o número e a natureza das variáveis latentes (fatores) que melhor representam um conjunto de variáveis observadas.

Sendo assim, o objetivo da AFE é identificar esses fatores e estimar as relações entre eles e as variáveis observadas. Para isso, a AFE parte de uma matriz de correlação ou covariância das variáveis observadas e usa técnicas estatísticas para extrair os fatores latentes que melhor explicam a estrutura dos dados.

Vale destacar que a AFE é uma técnica exploratória, ou seja, não parte de hipóteses pré-estabelecidas sobre os fatores latentes, mas busca identificá-los a partir dos padrões de correlação entre as variáveis observadas.

Variáveis latentes e observáveis

Agora que entendemos a ideia da análise fatorial aplicada a construtos psicológicos, fica mais fácil de entender sua função. Na psicometria, por meio da análise fatorial, queremos entender a relação entre as variáveis observáveis.

As variáveis observáveis são aquelas que conseguimos medir (por exemplo: comportamentos, sentimentos, emoções). Os itens de um instrumento são exemplos de variáveis observáveis. Já as variáveis latentes são um fenômeno que não conseguimos medir diretamente, mas que podemos inferir através da relação entre as variáveis observáveis.

Vamos analisar um exemplo para entender mais fácil. Na teoria das variáveis latentes, as psicopatologias são comumente pensadas como um transtorno que causa determinados sintomas. Nesse sentido, podemos entender um episódio depressivo da seguinte maneira:

Neste exemplo (meramente ilustrativo), os sintomas são as variáveis que podemos observar. Podemos criar uma pergunta em um instrumento de autorrelato onde a pessoa responde se está perdendo o sono e o apetite e se está com o humor e energia mais deprimidos que o normal.

Já a depressão é uma variável latente. Nós não podemos observar diretamente a depressão. No entanto, é possível dizer uma pessoa que está tendo um episódio depressivo, terá uma alteração naqueles sintomas que estamos avaliando.

Como a Análise Fatorial (Exploratória) funciona?

Até aqui entendemos o que são variáveis latentes e observáveis. Já passamos da metade do caminho, já que a função das análises fatoriais é justamente descobrir e modelar as variáveis latentes.

Para entender como a AFE funciona, vamos voltar ao nosso exemplo. Nós entendemos que há um transtorno “Depressão”. Então esperamos que, se medirmos a depressão, os itens que usamos vão estar relacionados.

Agora, se tentarmos relacionar um item que não tenha a ver com depressão em nosso instrumento, este item não deve se relacionar muito com os demais.

Veja o exemplo a seguir:

Nele, nós medimos os sintomas mencionados anteriormente, mas também achamos que algumas outras coisas também são sintomas de depressão e queremos validar nossa hipótese em uma pesquisa: agitação, preocupação, dificuldade de concentração e irritabilidade.

Cada retângulo no gráfico representa um sintoma medido através de um questionário aplicado a centenas de pessoas. Cada coluna representa as respostas de um grupo de indivíduos e o preenchimento em cada variável representa o quão alto é a resposta média das pessoas daquele grupo àquele sintoma.

Repare que existe uma relação bastante específica entre as variáveis e a divisão de grupos foi feita pensando nisto. No grupo 1 estão indivíduos que tiveram a média baixa nas primeiras 5 variáveis, nossos itens originais. Mas eles tiveram média alta nos itens novos.

Já no segundo grupo, aconteceu o contrário. Médias mais altas no primeiro grupo de variáveis e médias mais baixas no segundo grupo.

O terceiro grupo teve médias altas em ambos, e o quarto grupo está um pouco abaixo das médias em todas as variáveis.

Isso significa que é possível que haja um fator que explique as cinco primeiras variáveis e outro fator que explique as demais.

Na realidade, as quatro últimas variáveis são medidas mais relacionadas à ansiedade. Portanto, este poderia ser um instrumento que meça dois fatores: depressão e ansiedade.

No começo do estudo estávamos esperando que todas as variáveis formassem um único fator, msa a AFE serve como um primeiro passo para corroborar ou não com a nossa teoria.

Com isso, espero que você tenha entendido a função da análise fatorial exploratória: identificar a estrutura interna de um instrumento, de forma que nos informe como aqueles itens se agrupam em fatores.

Como fazer uma análise fatorial?

Agora, vou te dar um resumo de como fazer uma análise fatorial e o que esperar de resultados. Contudo, não vamos entrar em muitos detalhes, já que a análise fatorial é complexa e você deve seguir fontes acadêmicas confiáveis para te ajudar nas decisões tomadas para as análises. Mas deixe um comentário nos dizendo que aspectos da AFE você quer ver com mais detalhes!

Aliás, sugiro duas fontes boas para isso, este artigo do Bruno e o capítulo 11 do livro Manual de Desenvolvimento de Instrumentos Psicológicos, que é um tutorial de AFE usando o programa gratuito, Factor.

Vamos lá!

O princípio de uma análise fatorial é uma matriz de correlação ou de covariância entre todas as variáveis de interesse. À partir desta matriz que vamos entender como se dá a relação entre os itens. Portanto, todas as decisões sobre como fazer uma correlação se aplicam aqui.

De maneira geral, quando estamos lidando com instrumentos psicométricos, que costumam ter variáveis ordinais, devemos fazer uma correlação policórica. Usar a correlação de Pearson neste caso pode ser um erro, já que esta correlação é adequada apenas para variáveis contínuas.

Retenção fatorial

Depois de decidido o método de correlação, é necessário aplicar uma técnica para extração dos fatores. É isto que vai te ajudar a decidir qual é o melhor número de fatores para o seu instrumento. Existem alguns métodos de fazer a retenção.

Nesse sentido, a análise paralela e o método Hull apresentam como alternativas de métodos mais confiáveis e precisos para determinar o número de fatores a serem retidos.

Análise Paralela de Horn: Neste método, é gerada uma matriz de dados aleatórios com as mesmas dimensões da matriz original, mas com valores fixos de correlação entre as variáveis. O número de fatores a serem retidos é determinado pela comparação dos autovalores (eigenvalues) obtidos para cada conjunto de dados. Este método utiliza matrizes de correlações de Pearson para obter as matrizes aleatórias.

Análise Paralela (Optimal implementation): Também é um método baseado em simulação que usa dados aleatórios para criar um conjunto de autovalores (eigenvalues) que podem ser comparados com os autovalores (eigenvalues) reais da matriz de correlação.

A principal diferença em relação a Análise Paralela de Horn, é que a Análise Paralela (Optimal implementation) utiliza o mesmo tipo de correlações da matriz original, isto é, se a matriz original foi gerada por meio de correlações policóricas, as matrizes aleatórias também serão geradas por meio de correlações policóricas.

Método Hull: Pode-se dizer que o este método utiliza uma abordagem iterativa, começando com um modelo de um fator e adicionando gradualmente mais fatores até que o critério de retenção seja satisfeito.

Rotação fatorial

A rotação fatorial busca encontrar uma solução mais clara e interpretável nas análises fatoriais, onde cada variável tenha uma alta carga em um único fator e baixas cargas nos demais.

Existem dois tipos de rotação fatorial, as ortogonais e as oblíquas. As ortogonais assumem que não há correlação entre os fatores. Já as oblíquas permitem que haja correlação entre os fatores.

Todavia, as rotações ortogonais estipulam, a priori, que não há correlação entre os fatores (r = 0), gerando, portanto, fatores totalmente independentes uns dos outros. Entretanto, esse pressuposto é raramente obtido nas pesquisas das ciências humanas e da saúde. 

O adequado, na maioria dos casos, é uma rotação oblíqua. Existem diversos métodos de rotação, mas muitos tendem a ser igualmente bons: oblimin, quartimin, promax etc. Para mais detalhes sobre rotação fatorial, veja nosso post no qual apresentamos mais detalhes.

O que devemos verificar

Agora que temos o número de fatores e as rotações, finalmente podemos fazer a parte legal da análise: identificar que itens pertencem a que fator. O principal valor que devemos olhar são as cargas fatoriais. Elas indicam o quanto cada fator explica cada variável.

Os valores vão de -1 a 1, que indicam uma influência forte do fator. Já valores próximos a zero indicam uma influência fraca. Também devemos adotar um ponto de corte, que é o valor mínimo de carga fatorial para aceitar que aquele item pertença ao fator. Em geral, este ponto de corte é 0,3, mas valores mais altos, como 0,4 e 0,5 também costumam ser adotados.

A tabela seguinte é um exemplo de tabela de cargas fatoriais. Nela, temos as cargas fatoriais de um instrumento que avalia os cinco grandes fatores de personalidade. Nas linhas, temos as variáveis, e nas colunas temos cada um dos fatores.

Como podemos ver, nesta análise fatorial não encontramos 5 fatores de personalidade, encontramos 6! Os quatro primeiros fatores estão de acordo com o esperado — os nomes das variáveis designam os fatores em que os itens foram criados, por exemplo, C1 a C5 para os cinco itens sobre “conscienciosidade”.

Mas os fatores 5 e 6 não seguiram o modelo previsto. Eles se referem aos itens de abertura à experiência, que ficou dividido em dois fatores. Um com os itens O1, O3 e O4 e outro com os itens O2 e O5. Em uma pesquisa, esse seria o momento de identificar o que estes itens se propunham medir, reler a literatura e tentar entender se a divisão deste fator tem embasamento teórico.

Fator 1Fator 2Fator 3Fator 4Fator 5Fator 6
A1   -0.619  
A2   0.721  
A3   0.584  
A4    0.398  
A5    0.399  
C1  0.579   
C2  0.747   
C3  0.587   
C4  -0.631  
C5  -0.580   
E1 -0.740    
E2 -0.740    
E3 0.422   
E4 0.576    
E5 0.503    
N10.901     
N20.926     
N30.739     
N40.462    
N50.494     
O1    0.573 
O2     0.519
O3    0.624 
O4    0.396 
O5     0.575

Outra métrica importante de ser analisada são as comunalidades, que indicam o quanto cada variável é explicada por todos os fatores. Ela também tem valor entre -1 a 1 e pode indicar que uma variável não tem variância comum explicada por nenhum dos outros fatores.

Por último, podemos analisar a variância explicada por cada fator. Ela, evidentemente, explica o quanto de variância nos cada fator explica. Portanto, se um fator de variância explicada de 0,54, podemos dizer que ele explica 54% da variação daquelas variáveis.

Conclusão

A Análise Fatorial Exploratória é um assunto complexo, mas de extrema importância para o psicometrista. Como ela se baseia em muitos conhecimentos prévios, como os vários tipos de correlação e tem cálculos complexos, não se cobre entender tudo de uma vez, e nem em entender tudo a partir deste artigo. Mas eu espero que tenha sido uma boa introdução e uma visão geral do processo.

E já que você está por dentro do assunto, que tal assistir a este vídeo tutorial, daqui do Psicometria Online?

Gostou desse conteúdo? Precisa aprender Análise de dados? Faça parte da Psicometria Online Academy: a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).

BRUNO FIGUEIREDO DAMÁSIO

Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) eEditor-Associado da Spanish Journal of Psychology, na sub-seção Psicometri e Métodos Quantitativos.

Tenho mais de 50 artigos publicados e mais de 3000 citações, nas melhores revistas nacionais e internacionais. Atualmente, me dedico a formação de novos pesquisadores, através da Psicometria Online Academy. Minha missão é ampliar a formação em Psicometria no Brasil e lhe auxiliar a conquistar os seus objetivos profissionais.

Deseja se tornar completamente autônomo e independente na análise dos seus dados?

Uma resposta

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Veja mais

Posts relacionados

Teste de Wilcoxon

Teste de Wilcoxon

O teste de Wilcoxon é um teste de hipóteses para analisar a diferença entre duas amostras pareadas. Portanto, podemos usá-lo quando temos duas medidas de uma mesma amostra, isto é,

O que é um teste post hoc?

O que é um teste post hoc?

Alguma vez, durante a sua jornada como pesquisador, já deve ter se perguntado o que é um teste post hoc ou o que significa fazer um teste post hoc. Testes

O que é a distância de Cook?

O que é a distância de Cook?

A distância de cook é uma estatística para avaliar o quanto um único caso é capaz de influenciar a estimativa de um modelo de regressão.

Entenda o que são graus de liberdade

Entenda o que são graus de liberdade

Os graus de liberdade são uma medida que nos ajuda a determinar o número de observações independentes que temos em nossos dados. Em outras palavras, eles indicam quantos valores podemos

O que são parâmetros livres e fixos em uma AFC?

O que são parâmetros livres e fixos em uma AFC?

Parâmetros livres e fixos são uma parte fundamental para o entendimento da Análise Fatorial Confirmatória (AFC). É útil entender estes conceitos, para quando falarmos de índices de modificação e identificação

Teste de Wilcoxon

Teste de Wilcoxon

O teste de Wilcoxon é um teste de hipóteses para analisar a diferença entre duas amostras pareadas. Portanto, podemos usá-lo quando temos duas medidas de uma mesma amostra, isto é,

O que é um teste post hoc?

O que é um teste post hoc?

Alguma vez, durante a sua jornada como pesquisador, já deve ter se perguntado o que é um teste post hoc ou o que significa fazer um teste post hoc. Testes

O que é a distância de Cook?

O que é a distância de Cook?

A distância de cook é uma estatística para avaliar o quanto um único caso é capaz de influenciar a estimativa de um modelo de regressão.

Entenda o que são graus de liberdade

Entenda o que são graus de liberdade

Os graus de liberdade são uma medida que nos ajuda a determinar o número de observações independentes que temos em nossos dados. Em outras palavras, eles indicam quantos valores podemos

O que são parâmetros livres e fixos em uma AFC?

O que são parâmetros livres e fixos em uma AFC?

Parâmetros livres e fixos são uma parte fundamental para o entendimento da Análise Fatorial Confirmatória (AFC). É útil entender estes conceitos, para quando falarmos de índices de modificação e identificação

Cadastre-se para ser notificado com o link das aulas ao vivo:

Módulo 4: Redes neurais artificiais

• Introdução a Deep Learning

• Avaliando sistemas de Deep Learning

• Redes Neurais feitas (sem programação) no SPSS

• Aula bônus: O futuro da IA na Sociedade

• Aula bônus: Dois Estudos de Caso 

Módulo 3: Interpretar e reportar resultados

• Gerar, interpretar e reportar resultados em Machine Learning

Módulo 2: Criando o seu sistema

• Selecionando algoritmos e métodos 
• Práticas de Machine Learning (Sem programação): Decision Tree (JASP), Linear Discriminant Classification (JASP) e Plataforma ORANGE
• Aula Bônus: Avaliação Psicológica e Machine Learning
• Aula Bônus: Livros e Cursos recomendados  
• Aula Bônus: Entrevista com Cientista de Dados focado na área da Saúde

Módulo 1: O que é Machine Learning

• O que é Machine Learning?
• Como a máquina aprende?
• Machine Learning para Psicometria e Pesquisa Quantitativa (pesquisas comentadas)
• Tipos de Machine Learning (Supervisionado e Não-supervisionado)
• Práticas de Machine Learning (Sem programação): JASP e SPSS
Aula Bônus: Filosofia da Inteligência Artificial
• Aula Bônus: Entrevista com Cientista de Dados graduado em Psicologia
• Aula bônus: Estudo de Caso sobre Redução Dimensional 

Preencha abaixo para
participar gratuitamente

Fique tranquilo, não utilizaremos suas informações de contato para enviar qualquer tipo de SPAM. Os dados coletados são tratados nos termos da Lei Geral de Proteção de Dados e você pode se descadastrar da nossa lista de contatos a qualquer momento.