Kruskal-Wallis
Van Wikipedia
De Kruskal-Wallistoets, genoemd naar William Kruskal en Allen Wallis, is een verdelingsvrije toets in de statistiek, waarmee getoetst wordt of er verschil is tussen de verdelingen waaruit 3 of meer steekproeven afkomstig zijn. De nulhypothese die getoetst wordt, is eigenlijk dat de steekproeven uit verdelingen (populaties) zijn getrokken met dezelfde "ligging". De toets is gebaseerd op de rangnummers van de data. De Kruskal-Wallistoets is te beschouwen als een eenweg-ANOVA gebaseerd op de rangnummers.
[bewerk] Procedure
Gegeven zijn m onderling onafhankelijke aselecte steekproeven uit continue verdelingen. De je waarneming in de ie steekproef, die omvang ni heeft, is Xij. Het rangnummer hiervan in het totaal van de data is Rij. De toets verloopt verder in principe als een variantie-analyse uitgevoerd op deze rangnummers.
De toetsingsgrootheid K is:
,
waarin
het totaal aantal waarnemingen en
het gemiddelde rangnummer in de ie steekproef is.
Merk op dat de toetsingsgrootheid ook met kwadratensommen geschreven kan worden als:
,
waaruit de bovenstaande formule volgt door de substituties:
en
.
Als de steekproeven niet te klein van omvang zijn, is K onder de nulhypothese bij benadering chi-kwadraatverdeeld met n-m vrijheidsgraden.
[bewerk] Knopen
In principe mogen er geen knopen (gelijke waarnemingen) zijn. Zijn er teveel knopen, dan wordt de toetsingsgrootheid wel gecorrigeerd:
waarin tk het aantal data is met rangnummer k.
[bewerk] Zie ook