Standaardafwijking
Van Wikipedia
De standaardafwijking of standaarddeviatie, een begrip in de statistiek, is de wortel uit de variantie (zie aldaar voor formules). We moeten daarbij onderscheid maken of het gaat om een populatie of een steekproef. Voor een steekproef is de variantie (ongeveer) het gemiddelde van de kwadraten van de afwijking van de metingen ten opzichte van het gemiddelde van de gegevens. Bij een populatie is de variantie de verwachte kwadratische afwijking van de verwachtingswaarde. De standaardafwijking wordt gebruikt om de spreiding, (de mate waarin de waarden onderling verschillen) van een verdeling aan te geven. Je zou kunnen zeggen dat de standaarddeviatie de gemiddelde afwijking is van het gemiddelde. Een verschil tussen standaardafwijking en variantie is dat de standaardafwijking in dezelfde eenheid wordt uitgedrukt als de verwachtingswaarde of het gemiddelde, waardoor het zinnig wordt te spreken over het gemiddelde plus of min een aantal malen de standaardafwijking.
Dankzij de centrale limietstelling weten we verder dat het bij voldoende veel metingen veilig is aan te nemen dat de verdeling van de som van een groot aantal steekproeven van een onbekende verdeling de vorm van een normale verdeling heeft.
Voorwaarde daarvoor is wel dat die onbekende verdeling ook werkelijk volledig willekeurig is en een gemiddelde bezit. Dat laatste is meestal wel zo, maar lang niet alles wat er willekeurig uitziet is ook werkelijk volledig willekeurig.
Bij normale verdelingen wijkt van de mogelijke waarden:
- 68,2% ten hoogste 1 keer de standaardafwijking af van de verwachtingswaarde (het midden van de verdeling)
- 95,4% ten hoogste 2 keer de standaardafwijking af van de verwachtingswaarde
- 99,6% ten hoogste 3 keer de standaardafwijking af van de verwachtingswaarde
Statistici verrichten vaak meer metingen van dezelfde soort, d.w.z. uit dezelfde verdeling afkomstig, om het effect van de invloed van menselijk gedrag, de stand van de maan, kwantumeffecten en andere vormen van onvoorspelbare en onafhankelijke ruis te verminderen. Als alleen het gemiddelde vermeld was, zou je niet weten in hoeverre zulke ongrijpbare factoren een rol spelen. Ook het aantal metingen vertelt dat niet. Uit de standaardafwijking krijg je een indruk van zulke effecten.
Onderwerpen uit de beschrijvende statistiek |
Gemiddelden: Rekenkundig gemiddelde | Meetkundig gemiddelde | Harmonisch gemiddelde | Kwadratisch gemiddelde | Gewogen gemiddelde | Getrunceerd gemiddelde |
|
statistiek | kansrekening | statistische toets | betrouwbaarheid | significantie | kans | modus | mediaan | spreiding | standaardafwijking | kwartiel | percentiel | gemiddelde | schatten | verdelingsfunctie |