Legge della varianza totale
Da Wikipedia, l'enciclopedia libera.
La legge della varianza totale è un teorema della teoria della probabilità, che afferma che se X e Y sono variabili casuali definite sul medesimo spazio di probabilità, e la varianza di X è finita, allora:
Dal punto di vista della statistica più che della teoria della probabilità, il primo termine è detto componente non spiegata della varianza totale, e il secondo è la componente spiegata; tale suggestiva terminologia si ricollega all'analisi del modello lineare, e in particolare all'coefficiente di determinazione, o R².
Indice |
[modifica] Dimostrazione
La legge della varianza totale può essere immediatamente dimostrata sfruttando la legge delle aspettative iterate, come segue.
[modifica] Relazione con il modello lineare
La legge della varianza totale presenta un'importante relazione con il modello di regressione lineare. Nel caso univariato, il modello lineare può essere enunciato come:
Si ha in tal caso:
Ma allora, la componente spiegata della varianza totale altro non è che:
così che il rapporto tra l'espressione sopra e è il quadrato del coefficiente di correlazione tra
e
:
Tale grandezza corrisponde in effetti al coefficiente di determinazione R². È possibile ottenere un'analoga relazione nel caso multivariato.
[modifica] Estensioni ai momenti di ordine superiore
Esistono relazioni analoghe alla legge della varianza totale e alla legge delle aspettative iterate per i momenti centrali di ordine superiore. Ad esempio, con riferimento al momento centrale di ordine 3, si ha: