Stokastisk variabel
Fra Wikipedia, den frie encyklopædi
En stokastisk variabel er en type af variabel der beskriver et tilfældigt forsøg, hvor udfaldet ikke er kendt. Et synonym for en stokastisk variabel vil altså være en tilfældighedsvariabel, jf. det engelske random variable. Stokastiske variable benyttes oftest i forbindelse med sandsynlighedsregning og statistik.
Antager man et udfaldsrum E og et tilhørende sandsynlighedsmål P, definerer man en stokastisk variabel som en funktion fra E ind i de reelle tal .
Stokastiske variable betegnes ofte med store bogstaver som X, Y og Z.
[redigér] Eksempler på stokastiske variable
Et simpelt eksempel på brugen af stokastiske variable, er kast med en terninger. For en enkel terning kan vi definere den stokastiske variabel X, som er den bijektive afbildning . Således angiver den stokastiske variabel kun udfaldet, eller antallet af terningens øjne. Bruger man i stedet to terninger kan det være passende at definere en stokastisk variabel X, som angiver summen af øjnene i udfaldet. Denne stokastiske variabel er ikke injektiv; Vi ser, at vores stokastiske variabel er defineret på følgende måde:
Hidtil har vi kun set eksempler på diskrete stokastiske variable, men oftest har man også brug for at definere kontinuerte stokastiske variable – fx i forbindelse med en undersøgelse, hvor man måler højden på en tilfældigt udvalgt person af en population.
[redigér] Notation
Vi har tidligere defineret vores stokastiske variable som egentlige afbildninger. Således ville det umiddelbart være fornuftigt at se på egentlige udtryk, og fx kunne man betragte det tidligere eksempel med kast med to terninger på følgende måde:
X(T1,T2) = T1 + T2
hvor T1 og T2 angav øjnene på hver af terningerne. Imidlertidig har man en anden, ikke så intuitiv tilgang til notationen.
Først og fremmest er man oftest ligeglad med udfaldsrummet, andre gange har man ikke kendskab til dette. Et eksempel på dette er når man skal beregne sandsynligheden for et henfald inden for et givent tidsinterval. En klump radioaktivt stof, som man fortager undersøgelser på, er kilden til et meget stort og komplekst udfaldsrum, som vi ikke er synderligt interesserede. Således er vi ikke interesseret i de bagvedliggende udfald e, hvorfor vi vil notere den stokastiske variabel med X i stedet for X(e).
Da stokastiske variable er tæt knyttet til sandsynlighedsmål, som oftest er kontinuerte, vil man for det meste se på sandsynligheden for at den stokastiske variabel antager en værdi i en given delmængde . Man betegner denne hændelse
. Ved diskrete stokastiske variable skriver oftest P(X = a) i stedet, hvor a i sagens natur, angiver en skalar eller en vektor i
[redigér] Stokastiske variable og fordelinger
Når man beregner sandsynligheden for en hændelse P(X = a) eller har man oftest brug for fordelingsfunktioner, og sandsynlighedsfunktioner eller tæthedsfunktioner. En sandsynlighedsfunktion for en stokastisk variabel er givet ved følgende udtryk:
f(x) = P(X = x)
Hvor P er et sandsynlighedsmål. Som det er sagt i det tidligere afsnit, er det en notation, der oftest bruges om fordelinger på endelige mængder, og f(x) betegner altså sandsynligheden for at den stokastiske variabel antager netop skalaren eller vektoren x. For det sidste terningeeksemplet vil man eksempelvis kunne betragte hændelsen {X = 6} = summen af de to øjne er 6. Man finder hurtigt, at mulige kombinationer af udfald, som giver summen 6 er 5. Således finder vi
Det vil altså sige at sandsynligheden for at terningernes sum er 6, som den stokastiske variabel X altså er et mål for, er 5/36, under antagelse af at vi altså har med en ærlig terning at gøre. Samtidigt antager vi at hvert af terningekastene er uafhængige af hinanden.