Distribuição hipergeométrica
Origem: Wikipédia, a enciclopédia livre.
Em teoria das probabilidades e estatística, a distribuição hipergeométrica é uma distribuição de probabilidade discreta que descreve o número de sucessos numa sequência de n extracções de uma população finita, sem reposição.
Seja N um conjunto tal que existem K elementos classificados como sucesso e N-K elementos classificados como insucesso. Um conjunto de n elementos é seleccionado, aleatoriamente e sem reposição, do conjunto de N elementos. A variável aleatória X denota o número de sucessos na amostra. Então, X tem distribuição hipergeométrica e
onde x= 0,1,2,...,min(K,n) e onde refere-se ao coeficiente binomial, o número de combinações possíveis ao seleccionar b elementos de um total a.
O valor esperado da variável aleatória X é dado por
e a sua variância
- .
Quando o tamanho da população é muito maior do que a amostra (isto é, N é muito maior que n) a distribuição hipergeométrica é razoavelmente bem aproximada pela distribuição binomial com parâmetros n (número de tentativas) e p = K / N (probabilidade de sucesso numa tentativa única).
[editar] Exemplo
Um jogo de loteria consiste em selecionar seis dezenas do conjunto de cem dezenas de 00 a 99, com uma bola para cada dezena e sem reposição. Num volante (cartão aposta) o jogador pode escolher de 6 a 12 dezenas. Qual é a probabilidade de acertar-se a quina (5 dezenas) marcando-se 10 dezenas no volante?
Temos:
- N: total de dezenas, N = 100
- n: total de dezenas sorteadas, n = 6
- K: total de dezenas escolhidas, K = 10
- X: total de sucessos, queremos X = 5
A probabilidade de se acertar a quina é de aproximadamente 0,0003%.