Enkel logistisk regression
Wikipedia
Logistisk regression är en matematisk statistisk metod med vilken man kan analysera mätdata.
Metoden lämpar sig bäst då man är intresserad av att undersöka om det finns ett samband mellan en responsvariabel (Y) och en förklarande variabel (X), där Y endast kan anta två möjliga värden.
Exempel:
Man är intresserad av att studera om det finns ett samband mellan mängden tjära i lungorna (X) och huruvida lungcancer föreligger (Y). Responsvariabeln kan endast anta de två värdena JA eller NEJ, medan den förklarande variabeln (i princip) kan anta vilka positiva värden som helst. Då det inte är meningsfullt att söka efter ett samband av typen Y = β0 + β1X, som vid enkel linjär regression, är man vid enkel logistisk regression snarare intresserad av ett samband mellan sannolikheten p = P(Y = JA) att en enskild person har lungcancer och mängden tjära i denna persons lungor. Nu är inte heller modellen p = β0 + β1X lämplig, utan man använder sig istället av en icke-linjär transformation av vänsterledet för att få ett tal som ligger på hela den reella tallinjen , till skillad från sannolikheten p som bara kan anta värden mellan noll (0) och ett (1). Det finns många sådana transformationer. Den transformation som ger upphov till logistisk regression går under namnet Logit-transform och definieras av
Den enkla logistiska regressionsmodellen är därför Logit(p) = β0 + β1X.