Regressione logistica
Da Wikipedia, l'enciclopedia libera.
La regressione logistica è un caso particolare di modello lineare generalizzato avente come funzione link la funzione logit. Si tratta di un modello di regressione applicato nei casi in cui la variabile dipendente y sia di tipo dicotomico riconducibile ai valori 0 e 1, come lo sono tutte le variabili che possono assumere esclusivamente due valori: vero o falso, maschio o femmina, vince o perde, sano o ammalato, ecc.
Il modello viene descritto da
essendo la funzione logit e p la probabilità che l'evento y si verifichi.
La stima della probabilità di p avviene effettuando prima la stima dei parametri (utilizzando il metodo di massima verosomiglianza) e successivamente la trasformazione
Benché sia tecnicamente possibile applicare alla variabile y la regressione lineare
- y = α0 + α1x1 + α2x2 + α3x3 + + αkxk = Xα
ciò viene evitato in quanto porterebbe in generale a stime che vanno da meno infinito a più infinito e dunque fuori dall'intervallo [0,1] previsto per le probabilità.