Indice di correlazione di Pearson
Da Wikipedia, l'enciclopedia libera.
Il coefficiente di correlazione (lineare) di Pearson tra due variabili aleatorie o due variabili statistiche X e Y è definito come la loro covarianza divisa per il prodotto delle deviazioni standard delle due variabili:
.
dove
- σxy , è la covarianza tra X e Y
- σx,σy , sono le due deviazioni standard
Il coefficiente assume valori compresi tra -1 e +1.
Nel caso di indipendenza lineare il coefficiente assume valore zero, mentre non vale la conclusione opposta, ovvero dal coefficiente nullo non si può desumere l'indipenenza lineare.
Valori prossimi a +1 (o -1) possono essere misurati anche in presenza di relazioni non lineari. P.es. la seguente relazione quadratica (yi=xi²)
X: 1 2 3 4 Y: 1 4 9 16
produce un coefficiente pari a 0,9844.
Valori positivi vengono misurati in presenza di correlazione lineare positiva (p.es.: y=a+bx, dove b>0), mentre valori negativi vengono misurati in presenza di correlazione lineare negativa (p.es.: y=a+bx, con b<0).
[modifica] Voci correlate
- regressione lineare
- correlazione
- Karl Pearson
- Francis Galton, il primo a introdurre la lettera r (come abbreviazione di "regressione") anche se utilizzava un coefficiente diverso, in quanto normava usando lo scarto interquartile.