Reliabilitet
Wikipedia
Inom testning och mätningar anger reliabiliteten metodens tillförlitlighet i mätningen. Till exempel så skall resultatet vara detsamma vid upprepade mätningar (test-retest-reliabilitet), och oberoende om vem som utför testet (interbedömarreliabilitet). Av reliabilitet följer inte att man har validitet, som innebär att testet mäter det som det är avsett att mäta.
Reliabilitet avseende tester kan mätas på flera olika sätt. Vid test-retest-reliabilitet utför man upprepade mätningar på samma sätt, och mäter sedan korrelationen mellan de olika mättillfällena. En annan form av reliabilitet, intern konstistens (egentligen borde det heta intern konsekvens, men det engelska internal constitency har kommit att översättas så), avser hur väl olika delar av måttet mäter samma sak. Till exempel kan man önska att de olika frågorna ("items") i ett intelligenstest mäter intelligens på samma sätt. En metod för att mäta detta är split-half-metoden, som innebär att man delar upp frågorna i två hälfter, och beräknar sedan korrelationen mellan de båda hälfterna. Ett annat mått på den interna konstistensen är Cronbachs Alpha-värdet, som är ett sammafattande korrelationsmått mellan samtliga items.
[redigera] Klassisk testteori
Inom klassisk testteori definieras reliabiliteten matematiskt som andelen av den totala poängens varians som utgörs av den sanna poängens varians eller, annorlunda uttryckt, ett minus andelen av den totalpoängsvariansen som utgörs av felvariansen:
där
- ρxx' är reliabiliteten för det uppmätta värdet X,
- är variansen i den totala (uppmätta) poängen,
- är variansen i den sanna poängen och
- är felvariansen.
Den sanna poängen kan ju dock aldrig observeras direkt eller beräknas, så därför används olika metoder för uppskattning av reliabiliteten, som test-retest-reliabilitet, parallella test och intern konstistens. Varje sådan metod bygger på något skilda källor till felvarians.