Feilmargin
Fra Wikipedia, den frie encyklopedi
Feilmarginer uttrykker påliteligheten av et tall. Ingen målinger eller estimater av reelle størrelser eller modellparametere er helt feilfrie eller nøyaktige. For å kunne danne seg et bilde av hvor nøyaktig en måling eller et estimat har vært, angir man derfor ofte feilmarginer.
[rediger] Feilkilder
Det fins flere grunner til at alle målinger har feilmarginer:
- Målefeil. – Det er fysisk umulig å bygge måleinstrumenter med en uendelig presisjon. Å gjøre seg kjent med et måleinstruments feilmåling, f.eks. ved gjentatte kontrollmålinger, er en viktig bestanddel av enhver nøyaktig måling. Se målefeil.
- Statistisk feil. – Ønsker man å vite en gjennomsnittsverdi, er man ofte nødt til å måle en stikkprøve. Vil man f.eks. vite hvor høy jenter er når de fyller 18 år, er det umulig å måle alle jenter, man må m.a.o. begrense seg til en stikkprøve. Jo større stikkprøven er, desto mer representativ vil den være. Man kan imidlertid aldri anta at stikkprøven har identiske egenskaper som hele populasjonen. Grunnen er stokastiske (uforutsigbare) variasjoner mellom individene.
- Reell uskarphet. – Mange størrelser i naturen har uskarpe grenser. Vil man måle lengden på en kystlinje, må man pga. kystens fraktale struktur ta en vilkårlig avgjørelse på hvor «finkornet» målingen skal være. Vil man finne antallet arter, vil enhver telling være omtrentlig fordi artsdannelser kan ta tusenvis av år, og mange arter vil befinne seg midt i en slik fase der det ikke er mulig å fastslå om det dreier seg som én eller to arter. Vil man utføre målinger på elemantærpartikler, medfører uskarphetsrelasjonen at ikke alle partiklenes egenskaper kan måles presise samtidig.
Disse tre kildene til unøyaktighet vil vanligvis opptre samtidig, og sammenfattes i en felles feilmargin. Under visse betingelser kan det imidlertid være mulig å skille mellom usikkerhetens tre komponenter.
[rediger] Måter å angi feilmarginer på
Den vanligste måten å angi feilmarginer på er ved å sette et feilmål bak målingen, atskilt med pluss/minus-tegnet, f.eks.
- 12,34 ± 0,56 (SD),
som altså betyr at den reelle verdien antas å ligge mellom 11,78 og 12,90. De mest brukte feilmålene er:
- Standardavvik (SD) og standardfeil (SE), som begge er avledet av målingen(e)s varians.
- Konfidensintervaller (CI) foretrekkes i noen sammenhenger, bl.a. når feilmarginene er asymmetriske, dvs. feilen er større nedenfor enn ovenfor estimatet (eller omvendt). I så fall bruker man ikke ±, men en intervallangivelse, f.eks.
-
- 12,34 [11,48; 15,72] (95% CI)
- Ekstremer (dvs. den minste og den største verdien) brukes sjeldnere, hovedsakelig fordi de fleste fordelinger ikke har minste eller største verdier. Ekstremverdier kan brukes for å beskrive stikkprøven, men ikke hele populasjonen.
Hvilket feilmål som er brukt, må alltid angis.
En enklere måte å ta høyde for feilmarginer på, er å bare angi de sikre (eller signifikante) sifrene i en måling. Således er det stor forskjell mellom angivelsene 12,34 og 12,3400. Det sistnevnte tallet har fire sikre desimaler, dvs. at det kommer fra en hundre ganger mer nøyaktig måling enn det første tallet. 12,34 er dermed omtrent ensbetydende med 12,340 ± 0,005, mens 12,3400 betyr 12,34000 ± 0,00005.
Dette prinsippet syndes det mye mot. Når man f.eks. leser at «av sju testpersoner ga kun 42,9 % svaralternativ X», så er det gitt altfor mange sifre, selv om tallet matematisk sett (3 av 7 = 42,857... %) er korrekt. Med en stikkprøvestørrelse på 7 kan man imidlertid ikke angi mer enn ett signifikant siffer: «Av sju testpersoner ga kun 40 % svaralternativ X» hadde altså vært riktig.