Desvio padrão
Origem: Wikipédia, a enciclopédia livre.
Em probabilidade e Estatística, o desvio padrão é a medida mais comum da dispersão estatística. O desvio-padrão define-se como a raiz quadrada da variância. É definido desta forma de maneira a dar-nos uma medida da dispersão que seja:
- um número não negativo;
- use as mesmas unidades de medida que os nossos dados.
Faz-se uma distinção entre o desvio padrão σ (sigma) do total de uma população ou de uma variável aleatória, e o desvio padrão s de um sub-conjunto em amostra.
O termo desvio padrão foi introduzido na estatística por Karl Pearson no seu livro de 1894: "Sobre a dissecção de curvas de frequência assimétricas".
Índice |
[editar] Definição e cálculo
[editar] Desvio padrão de uma variável aleatória
O desvio padrão de uma variável aleatória X é definido como:
onde E(X) é o valor esperado de X.
Nem todas variáveis aleatórias possuem desvio padrão, desde que esses valores esperados não precisam existir. Por exemplo, o desvio padrão de uma variável que flui em uma distribuição de Cauchy é indefinida.
Se uma variável aleatória X toma os valores x1,...,xN (que são números reais) com igual probabilidade, então seu desvio padrão pode ser computada como segue. Primeiro, a média de X, , é definida como:
(veja notação sigma). Depois, o desvio padrão simplifica-se em:
Em outras palavras, o desvio padrão de uma variável aleatória uniformizada discreta X pode ser calculada como:
- Para cada valor xi calcula-se a diferença entre xi e o valor médio .
- Calcula-se o quadrado dessa diferença.
- Encontra-se a média das diferenças dos quadrados. Esta quantidade é a variância. σ2.
- Tome a raiz quadrática da variância.
[editar] Propriedades
De uma distribuição normal unimodal, simétrica, de afunilamento médio (ou mesocúrtica) podemos dizer o seguinte:
- 68% dos valores encontram-se a uma distância da média inferior a um desvio padrão.
- 95% dos valores encontram-se a uma distância da média inferior a duas vezes o desvio padrão.
- 99,7% dos valores encontram-se a uma distância da média inferior a três vezes o desvio padrão.
Esta informação é conhecida como a regra dos "68-95-99,7".