Correlazione
Da Wikipedia, l'enciclopedia libera.
Per correlazione si intende una relazione tra due variabili tale che a ciascun valore della prima variabile corrisponda con una certa regolarità un valore della seconda. Non si tratta necessariamente di un rapporto di causa ed effetto ma semplicemente della tendenza di una variabile a variare in funzione di un'altra. Talvolta le variazioni di una variabile dipendono dalle variazioni dell'altra (relazione tra la statura dei padri e quella dei figlio ad esempio), talvolta sono comuni (relazioni tra la statura e il peso di un individuo); talvolta sono reciprocamente dipendenti (relazione tra prezzo e domanda di una merce: il prezzo influisce sulla domanda e la domanda influisce sul prezzo).
La correlazione si dice diretta o positiva quando variando una variabile in un senso anche l'altra varia nello stesso senso (alle stature alte dei padri corrispondono stature alte dei figli); si dice indiretta o inversa quando variando una variabile in un senso l'altra varia in senso inverso (a una maggiore produzione di grano corrisponde un prezzo minore). La correlazione dicesi semplice quando i fenomeni posti in relazione sono due (per esempio, numero dei matrimoni e il numero delle nascite); doppia quando i fenomeni sono tre (per esempio, circolazione monetaria, prezzi e risparmio); tripla quando sono quattro ecc...
Il grado di correlazione fra due variabili viene espresso mediante i cosiddetti indici di correlazione. Questi assumono valori compresi tra zero (quando vi sia assenza di correlazione cioè quando variando una variabile l'altra non varia o varia in modo del tutto indipendente) e l'unità (quando vi sia correlazione assoluta cioè quando alla variazione di una variabile corrisponde una variazione rigidamente dipendente dall'altra).
I coefficienti di correlazione sono derivati dagli indici di correlazione tenendo presenti le grandezze degli scostamenti dalla media. I risultati degli indici e dei coefficienti di correlazione devono comunque sempre ritenersi approssimativi data l'arbitrarietà con cui vengono scelti gli elementi che esercitano la loro influenza sui fenomeni specialmente nel caso che si tratti di correlazioni multiple.
[modifica] Cenni Storici
In statistica, il termine correlazione compare per la prima volta in un lavoro di Francis Galton (Hereditary Genius, 1869), senza venir ulteriormente definita ("la moralità di un individuo e la sua instabilità morale sono non correlate").
Nel 1877 lo stesso autore scopre che i coefficienti di regressione lineare di y su x e di x su y sono gli stessi se sia x che y sono normalizzate secondo la loro deviazione standard σx e σy (in realtà Galton usa lo scarto interquartile), e chiama questo parametro coefficiente di co-relazione, dandogli il nome r come abbreviazione di regressione.