A importância do
Gráfico Box Plot na estatística
descritiva
As estatísticas descritivas são breves coeficientes
descritivos que resumem um conjunto de dados, que pode ser ou uma representação
de toda a população ou uma amostra de uma população. A estatística descritiva é
composta por medidas de tendência central e medidas de variabilidade (
dispersão). As medidas de tendência central incluem a média, mediana e modo,
enquanto as medidas de variabilidade incluem o desvio padrão, variância,
variáveis mínimas e máximas, curtose, e achatamento (Investopedia, 2022).
Figura 1https://cds.climate.copernicus.eu/toolbox/doc/gallery/54_box_plots.html
Na estatística descritiva, um gráfico de caixa ou boxplot
(também conhecido como box and whisker plot) é um tipo de gráfico
frequentemente utilizado na análise de dados explanatórios. As parcelas de
caixa mostram visualmente a distribuição dos dados numéricos e o achatamento
através da exibição dos quartis de dados (ou percentis) e das médias.
As parcelas de caixa mostram o resumo de cinco números de um
conjunto de dados: incluindo a pontuação mínima, primeiro quartil (inferior),
mediana, terceiro quartil (superior), e pontuação máxima.
Então, ao utilizar esta tipologia de gráfico para os seus trabalhos
vamos explicar o que é cada conceito e como interpretar cada um deles
Pontuação Mínima
A pontuação mais baixa, excluindo os outliers (mostrados no
final do whisker da esquerda).
Quartil inferior
Vinte e cinco por cento das pontuações ficam abaixo do valor
do quartil inferior (também conhecido como primeiro quartil).
Mediana
A mediana marca o ponto médio dos dados e é mostrada pela
linha que divide a caixa em duas partes (por vezes conhecida como o segundo
quartil). Metade das pontuações são superiores ou iguais a este valor e metade
são inferiores.
Quartil Superior
Setenta e cinco por cento das pontuações ficam abaixo do
valor do quartil superior (também conhecido como o terceiro quartil). Assim,
25% dos dados estão acima deste valor.
Pontuação máxima
A pontuação mais alta, excluindo os outliers (mostrados no
final do whisker da direita).
Os “bigodes”
Os bigodes superiores e inferiores representam pontuações
fora do meio 50% (ou seja, os 25% inferiores e os 25% superiores das
pontuações).
O intervalo
interquartil (ou IQR)
Este é o gráfico da caixa que mostra os 50% médios das
pontuações (ou seja, o intervalo entre o percentil 25 e 75).
COMO INTERPRETAR
Figura 2 https://www.simplypsychology.org/boxplots.html
Passo 1: Compare
as medianas das parcelas de caixa
Comparar as respetivas medianas de cada parcela de caixa. Se
a linha mediana de uma parcela de caixa estiver fora da caixa de uma parcela de
caixa de comparação, então é provável que haja uma diferença entre os dois
grupos.
Passo 2: Comparar
os intervalos interquartis e os “bigodes” das parcelas de caixa.Comparar os
intervalos interquartis (ou seja, os comprimentos das caixas), para examinar
como os dados estão dispersos entre cada amostra. Quanto maior for o
comprimento da caixa, mais dispersos ficam os dados. Quanto menor, menos
dispersos ficam os dados.
Passo 3: Procure
potenciais aberturas.
Ao rever uma parcela de caixa, um outlier é definido como um
ponto de dados que se encontra fora dos bigodes da parcela de caixa.
Passo 4: Procura
de sinais de enviesamento
Se os dados não parecem ser simétricos, será que cada
amostra mostra o mesmo tipo de assimetria?
Obras Citadas
Box plots.
(2022). Obtido em 2022 de 06 de 2022, de
https://cds.climate.copernicus.eu/toolbox/doc/gallery/54_box_plots.html
Investopedia. (2022). Descriptive Statistics.
doi:https://www.investopedia.com/terms/d/descriptive_statistics.asp
McLeod, S. (s.d.). What does a box plot tell you?
Simply psychology2019. Obtido de
https://www.simplypsychology.org/boxplots.html
Sem comentários:
Enviar um comentário