Kurtosis
Van Wikipedia
Het begrip kurtosis (vaak ook platheid genoemd) is een maat voor 'piekvormigheid' in de statistiek. Kurtosis is zowel te berekenen voor een kansverdeling als een steekproef. Een hoge kurtosis wijst op een verdeling, of data, met een sterke piek. Dit houdt in dat een relatief groot deel van de variantie veroorzaakt wordt door zeldzame extreme waarden. Een lage kurtosis wijst op een platte verdeling, of data. Hier wordt de variantie voornamelijk veroorzaakt door een groter deel minder extreme waarden.
Inhoud |
[bewerk] Definitie
Voor kurtosis worden in de statistische literatuur twee verschillende definities gebruikt. Als eerste, wordt kurtosis gedefinieerd als het vierde gestandaardiseerde moment:
waarbij μ4 = E((X − μ)4) het vierde centrale moment is, en σ de standaarddeviatie.
Het meestgebruikt is de volgende definitie van kurtosis
Een wiskundige theoretische reden voor deze aangepaste definitie is dat de kurtosis nu gelijk is aan het quotiënt van het vierde cumulant en het kwadraat van de variantie. Een praktische reden is dat volgens deze formule, de normale verdeling een kurtosis gelijk aan nul heeft.
- Een positieve kurtosis duidt op een stevige piekvorm van de kansverdeling, dit wordt leptokurtosisch genoemd. Voorbeelden van leptokurtosische verdelingen zijn de Laplace verdeling en de logistische verdeling.
- Een negatieve kurtosis duidt op een platte vorm van de kansverdeling, dit wordt platykurtosisch genoemd. Voorbeelden hiervan zijn de uniforme verdeling. De meest platykurtosische verdeling is de Bernoulli-verdeling met parameter p = -2, deze heeft een kurtosis van -2.
- Verdelingen met kurtosis 0 worden mesokurtosisch genoemd. Voorbeelden hiervan zijn de normale verdelingen.
[bewerk] Eigenschappen
- Als X een normale verdeling volgt, dan is γ2(X) = 0.
- Als Y de som is van n onafhankelijke, identiek verdeelde toevalsgrootheden X, dan is γ2(Y) = γ2(X)/n
- Als X1, ..., Xn onafhankelijke toevalsgrootheden zijn, allen met dezelfde variantie, dan geldt dat
.
NB: deze drie eigenschappen gelden voor γ2 en niet voor γ'2.
[bewerk] Steekproefkurtosis
Voor een steekproef van n waarden is de steekproefkurtosis gelijk aan
waar xi de ide waarde is en het steekproefgemiddelde. Omdat dit geen zuivere schatter voor de populatiekurtosis is, dat wil zeggen
, wordt in praktijk, en in de meeste softwarepakketten, meestal de volgende, wel zuivere, schatter gebruikt
[bewerk] Voorbeeld
Beschouw de steekproef 1, 2, 4, 5. Hiervoor geldt n = 4 en . De scheefheid is als volgt
en
Onderwerpen uit de beschrijvende statistiek |
Gemiddelden: Rekenkundig gemiddelde | Meetkundig gemiddelde | Harmonisch gemiddelde | Kwadratisch gemiddelde | Gewogen gemiddelde | Getrunceerd gemiddelde |