O que é o processo de retenção fatorial?
A retenção de fatores é o processo pelo qual é determinado o número de fatores que devem ser extraídos a partir de um conjunto de dados para explicar a maior parte da variância observada nas variáveis originais. No entanto, nem todos os fatores extraídos são necessários para explicar a estrutura dos dados. Assim, a retenção de fatores é um processo de seleção de um número menor de fatores que são mais importantes e que explicam a maior parte da variância nas variáveis originais. Esse processo é aplicado quando realizamos Análise Fatorial Exploratória (AFE).
A etapa de retenção fatorial pode ser considerada a mais importante da análise fatorial exploratória, pois a retenção fatorial pode afetar diretamente a interpretação dos resultados e a identificação dos padrões subjacentes nos dados.
Se forem extraídos muitos fatores, a estrutura fatorial pode se tornar difícil de interpretar e os resultados podem se tornar menos confiáveis. Por outro lado, se forem extraídos poucos fatores, pode haver perda de informações importantes e a estrutura fatorial não será capaz de explicar adequadamente a variabilidade das variáveis originais.
Os principais métodos de retenção fatorial utilizados na análise fatorial exploratória
Critério de Kaiser: Este é o método mais comumente utilizado para determinar o número de fatores a serem retidos. Ele se baseia no valor próprio de cada fator, e sugere que apenas os fatores com autovalores (eigenvalues) acima de 1,0 devem ser mantidos na análise.
Método de scree plot: Este método envolve a plotagem do gráfico de autovalores (eigenvalues) em ordem decrescente. O número de fatores a serem retidos é determinado pelo ponto onde a curva se aplaina, ou “scree”, o que indica o número de fatores mais significativos.
Antes de prosseguirmos, cabe ressaltar que estes dois primeiros métodos de retenção estão em desuso por superestimar o número de fatores, além de serem métodos ultrapassados em relação aos atuais. Portanto devem ser evitados.
Nesse sentido, a análise paralela, o método Hull e Exploratory Graph Analysis se apresentam como alternativas de métodos mais confiáveis e precisos para determinar o número de fatores a serem retidos.
Análise Paralela de Horn: Neste método, é gerada uma matriz de dados aleatórios com as mesmas dimensões da matriz original, mas com valores fixos de correlação entre as variáveis. O número de fatores a serem retidos é determinado pela comparação dos autovalores (eigenvalues) obtidos para cada conjunto de dados. Este método utiliza matrizes de correlações de Pearson para obter as matrizes aleatórias.
Análise Paralela (Optimal implementation): Também é um método baseado em simulação que usa dados aleatórios para criar um conjunto de autovalores (eigenvalues) que podem ser comparados com os autovalores (eigenvalues) reais da matriz de correlação.
A principal diferença em relação a Análise Paralela de Horn, é que a Análise Paralela (Optimal implementation) utiliza o mesmo tipo de correlações da matriz original, isto é, se a matriz original foi gerada por meio de correlações policóricas, as matrizes aleatórias também serão geradas por meio de correlações policóricas.
Método Hull: Pode-se dizer que o este método utiliza uma abordagem iterativa, começando com um modelo de um fator e adicionando gradualmente mais fatores até que o critério de retenção seja satisfeito.
Em cada iteração, é avaliada a qualidade do ajuste do modelo e é verificado se o critério de retenção é atendido. Se o critério não for satisfeito, outro fator é adicionado e o processo é repetido até que o critério seja atendido ou até que o número máximo de fatores seja alcançado.
Outro método recente e promissor, por apresentar desempenho semelhante a análise paralela e método Hull é o Exploratory Graph Analysis que abordaremos a seguir.
Exploratory Graph Analysis: Também conhecido como EGA, é uma nova técnica recentemente proposta no âmbito da psicometria de rede para estimar o número de fatores subjacentes a dados multivariados. O número de dimensões é verificado usando o walktrap, um algoritmo de passeio aleatório usado para identificar comunidades em redes.
Esse método, por enquanto, apenas pode ser aplicado por meio de um pacote no R chamado EGAnet. Para saber mais detalhes você pode acessar nosso post sobre EGA.
Por fim vale algumas dicas: é importante utilizar mais de um método (que não seja o critério de Kaiser ou Scree plot) , verificar se os fatores extraídos fazem sentido teoricamente, e se os itens agrupados em cada fator são coerentes com a dimensão correspondente.
Espero que este post tenha te ajudado a entender o que são os métodos de retenção fatorial.
Ficou interessado em saber mais sobre Análise Fatorial Exploratória? Clique aqui e veja nosso post super completo sobre o tema.
Gostou desse conteúdo? Precisa aprender Análise de dados? Faça parte da Psicometria Online Academy: a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).