Rozkład Benforda
Z Wikipedii
Rozkład Benforda to rozkład prawdopodobieństwa występowania określonej pierwszej cyfry w "losowych" liczbach o podstawie 10. Termin "losowe" liczby dotyczy w tym przypadku rzeczywistych danych statystycznych, np. dane dotyczące powierzchni jezior w Polsce, dane z rocznika statystycznego, wartości stałych fizycznych.
Prawdopodobieństwo wystąpienia cyfry k to
Prawdopodobieństwo to jest proporcjonalne do odstępu między kolejnymi cyframi na skali logarytmicznej, więc zgodność danych z rozkładem Benforda oznacza, że "losowe" liczby są rozmieszczone równomiernie na skali logarytmicznej.
Rozkład ten został po raz pierwszy zaobserwowany przez amerykańskiego astronoma S. Newcomba w 1881 roku, a ponownie odkryty przez S. Benforda w 1938.
Rozkład Benforda jest stosowany do sprawdzania poprawności zeznań podatkowych bądź defraudacji, gdyż ludzie wpisując "losowe" liczby nie są świadomi, że pewne cyfry występują częściej na pierwszej pozycji.
Częstotliwości występowania cyfr na pierwszej pozycji są przedstawione w tabeli poniżej.
Pierwsza cyfra | Częstość |
---|---|
1 | 30,1% |
2 | 17,6% |
3 | 12,5% |
4 | 9,7% |
5 | 7,9% |
6 | 6,7% |
7 | 5,8% |
8 | 5,1% |
9 | 4,6% |
[edytuj] Źródła
- Romak Nowak, Statystyka dla fizyków, PWN, 2002