Receba gratuitamente todos os nossos conteúdos.

Fique por dentro das novidades e oportunidades referentes à Psicometria e Análise Quantitativa de Dados.

Medidas de dispersão: amplitude, a variância e o desvio padrão

Se você já se perguntou como as medidas de dispersão podem ajudar a entender os padrões dos dados da sua pesquisa, este post é para você!

Hoje, vamos explorar o que são medidas de dispersão e as três medidas essenciais: a amplitude, a variância e o desvio padrão, e descobrir como elas podem ajudar a entender como seus dados “se comportam”.

Medidas de dispersão ou de variabilidade

Medidas de dispersão ou de variabilidade são medidas estatísticas usadas para medir a quantidade de variação ou dispersão que existe em um conjunto de dados. Elas são úteis na pesquisa científica porque nos ajudam a avaliar a variabilidade dos dados e a identificar valores extremos ou outliers, nos permitem também avaliar o quão homogêneo ou heterogêneo é um conjunto de dados.

Existem várias medidas de dispersão que podem ser usadas, dependendo das necessidades específicas da pesquisa. As medidas de dispersão mais comuns incluem a amplitude, a variância e o desvio padrão.

Amplitude

A amplitude é a diferença entre o maior e o menor valor em um conjunto de dados. Por exemplo, se tivermos um conjunto de dados que contém as idades de um grupo de pessoas (18, 20, 22, 24, 26), a amplitude seria 8 (26 – 18).

Variância

A variância é uma medida de dispersão que mostra o quão espalhados os dados estão em relação à média. Suponha que temos um conjunto de dados que representa o número de horas que um grupo de estudantes estuda por dia durante uma semana:

4, 5, 3, 7, 6, 5, 4

Para calcular a variância, precisamos seguir esta fórmula:

variância = soma dos quadrados das diferenças entre cada valor e a média dividido pelo número de observações – 1

Passo 1: Primeiro, precisamos calcular a média dos dados. Para isso, somamos todos os valores e dividimos pelo número de observações:

média = (4 + 5 + 3 + 7 + 6 + 5 + 4) / 7 = 4.86 (aproximadamente)

Passo 2: Calcule as diferenças entre cada valor e a média. Em seguida, subtraímos a média de cada valor para obter as diferenças entre cada valor e a média:

4 – 4.86 = -0.86 ; 5 – 4.86 = 0.14; 3 – 4.86 = -1.86; 7 – 4.86 = 2.14; 6 – 4.86 = 1.14

5 – 4.86 = 0.14; 4 – 4.86 = -0.86

Passo 3: Eleve as diferenças ao quadrado Agora, elevamos cada diferença ao quadrado:

(-0.86)^2 = 0.7396; (0.14)^2 = 0.0196; (-1.86)^2 = 3.4596; (2.14)^2 = 4.5796; (1.14)^2 = 1.2996;

(0.14)^2 = 0.0196; (-0.86)^2 = 0.7396

Passo 4: Agora, somamos as diferenças ao quadrado:

0.7396 + 0.0196 + 3.4596 + 4.5796 + 1.2996 + 0.0196 + 0.7396 = 10.8576

Passo 5: Finalmente, dividimos a soma das diferenças ao quadrado pelo número de observações menos 1:

variância = 10.8576 / (7 – 1) = 1.52394 (aproximadamente)

Temos que a variância do conjunto de dados é aproximadamente 1.52394. Isso significa que a dispersão dos dados em relação à média é de cerca de 1.52 horas quadradas.

Note que a unidade de medida da variância é o quadrado da unidade original dos dados, ou seja, horas ao quadrado neste exemplo. O que dificulta a interpretação, não é mesmo?

Por isso, é comum calcular o desvio padrão, que é a raiz quadrada da variância e tem a mesma unidade de medida dos dados originais. Vamos conhecer melhor o desvio-padrão!

Desvio-padrão

O desvio padrão é uma medida de dispersão que indica o quanto os dados se desviam da média. Ele é calculado encontrando a raiz quadrada da variância. A fórmula para o desvio padrão é:

desvio padrão = raiz quadrada da variância.

Vamos usar o exemplo anterior para calcular o desvio padrão. Primeiro precisamos encontrar a variância, que já foi calculada na minha resposta anterior, sendo igual a aproximadamente 1.52394.

O desvio padrão é a raiz quadrada da variância. Portanto, para encontrar o desvio padrão, precisamos calcular a raiz quadrada de 1.52394:

desvio padrão = raiz quadrada de 1.52394 desvio padrão = 1.23316 (aproximadamente)

Agora que você sabe como essas medidas de variabilidade são calculadas manualmente, você tem uma compreensão mais profunda da matemática por trás dessas medidas. Isso pode ajudá-lo a entender melhor as limitações e as nuances envolvidas nas medidas de variabilidade. Por exemplo, usar a medida de desvio-padrão ao invés da variância.

E não se preocupe, embora as medidas de variabilidade possam parecer complicadas de calcular manualmente, elas são facilmente obtidas por meio dos softwares estatísticos (ex. SPSS, JASP, Jamovi, etc.).

Gostou desse conteúdo? Precisa aprender Análise de dados? Faça parte da Psicometria Online Academy: a maior formação de pesquisadores quantitativos da América Latina. Conheça toda nossa estrutura aqui e nunca mais passe trabalho sozinho(a).

BRUNO FIGUEIREDO DAMÁSIO

Sou Psicólogo, mestre e doutor em Psicologia. Venho me dedicando à Psicometria desde 2007.

Fui professor e chefe do Departamento de Psicometria da UFRJ durante os anos de 2013 a 2020. Fui editor-chefe da revista Trends in Psychology, da Sociedade Brasileira de Psicologia (SBP) eEditor-Associado da Spanish Journal of Psychology, na sub-seção Psicometri e Métodos Quantitativos.

Tenho mais de 50 artigos publicados e mais de 3000 citações, nas melhores revistas nacionais e internacionais. Atualmente, me dedico a formação de novos pesquisadores, através da Psicometria Online Academy. Minha missão é ampliar a formação em Psicometria no Brasil e lhe auxiliar a conquistar os seus objetivos profissionais.

Deseja se tornar completamente autônomo e independente na análise dos seus dados?

Uma resposta

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Veja mais

Posts relacionados

Um Guia Completo sobre a PEDro: Physiotherapy Evidence Database

Um Guia Completo sobre a PEDro: Physiotherapy Evidence Database

Se você é um profissional ou um estudante da área da saúde e está interessado nas práticas baseadas em evidências, este post é para você. Vamos descobrir como a base

Diferença entre as regressões logísticas: binária, ordinal e multinomial

Diferença entre as regressões logísticas: binária, ordinal e multinomial

A análise de regressão é uma técnica amplamente utilizada para verificar a existência de uma relação entre uma variável dependente e uma ou mais variáveis independentes. Existem diferentes tipos de

Construção de itens para instrumentos de autorrelato

Construção de itens para instrumentos de autorrelato

A elaboração de itens para instrumentos de autorrelato desempenha um papel crucial na pesquisa psicométrica, pois é por meio deles que os participantes expressam suas próprias experiências e percepções. Neste

Dados Normativos: Entendendo o Escore Z

Dados Normativos: Entendendo o Escore Z

Interpretar os resultados derivados do uso de um teste é tão crucial quanto criar ou adaptar os instrumentos e aplicá-los corretamente. Para a interpretação dos resultados, é essencial a criação

Compreendendo a Confiabilidade Duas-Metades (Split-Half Reliabity)

Compreendendo a Confiabilidade Duas-Metades (Split-Half Reliabity)

No campo da Psicometria, pesquisadores e profissionais frequentemente buscam garantir a precisão e consistência de seus instrumentos de medição. Um dos métodos usados para avaliar a confiabilidade de um teste

Um Guia Completo sobre a PEDro: Physiotherapy Evidence Database

Um Guia Completo sobre a PEDro: Physiotherapy Evidence Database

Se você é um profissional ou um estudante da área da saúde e está interessado nas práticas baseadas em evidências, este post é para você. Vamos descobrir como a base

Diferença entre as regressões logísticas: binária, ordinal e multinomial

Diferença entre as regressões logísticas: binária, ordinal e multinomial

A análise de regressão é uma técnica amplamente utilizada para verificar a existência de uma relação entre uma variável dependente e uma ou mais variáveis independentes. Existem diferentes tipos de

Construção de itens para instrumentos de autorrelato

Construção de itens para instrumentos de autorrelato

A elaboração de itens para instrumentos de autorrelato desempenha um papel crucial na pesquisa psicométrica, pois é por meio deles que os participantes expressam suas próprias experiências e percepções. Neste

Dados Normativos: Entendendo o Escore Z

Dados Normativos: Entendendo o Escore Z

Interpretar os resultados derivados do uso de um teste é tão crucial quanto criar ou adaptar os instrumentos e aplicá-los corretamente. Para a interpretação dos resultados, é essencial a criação

Compreendendo a Confiabilidade Duas-Metades (Split-Half Reliabity)

Compreendendo a Confiabilidade Duas-Metades (Split-Half Reliabity)

No campo da Psicometria, pesquisadores e profissionais frequentemente buscam garantir a precisão e consistência de seus instrumentos de medição. Um dos métodos usados para avaliar a confiabilidade de um teste

Cadastre-se para ser notificado com o link das aulas ao vivo:

Módulo 4: Redes neurais artificiais

• Introdução a Deep Learning

• Avaliando sistemas de Deep Learning

• Redes Neurais feitas (sem programação) no SPSS

• Aula bônus: O futuro da IA na Sociedade

• Aula bônus: Dois Estudos de Caso 

Módulo 3: Interpretar e reportar resultados

• Gerar, interpretar e reportar resultados em Machine Learning

Módulo 2: Criando o seu sistema

• Selecionando algoritmos e métodos 
• Práticas de Machine Learning (Sem programação): Decision Tree (JASP), Linear Discriminant Classification (JASP) e Plataforma ORANGE
• Aula Bônus: Avaliação Psicológica e Machine Learning
• Aula Bônus: Livros e Cursos recomendados  
• Aula Bônus: Entrevista com Cientista de Dados focado na área da Saúde

Módulo 1: O que é Machine Learning

• O que é Machine Learning?
• Como a máquina aprende?
• Machine Learning para Psicometria e Pesquisa Quantitativa (pesquisas comentadas)
• Tipos de Machine Learning (Supervisionado e Não-supervisionado)
• Práticas de Machine Learning (Sem programação): JASP e SPSS
Aula Bônus: Filosofia da Inteligência Artificial
• Aula Bônus: Entrevista com Cientista de Dados graduado em Psicologia
• Aula bônus: Estudo de Caso sobre Redução Dimensional 

Preencha abaixo para
participar gratuitamente

Fique tranquilo, não utilizaremos suas informações de contato para enviar qualquer tipo de SPAM. Os dados coletados são tratados nos termos da Lei Geral de Proteção de Dados e você pode se descadastrar da nossa lista de contatos a qualquer momento.