Variabile casuale
Da Wikipedia, l'enciclopedia libera.
In teoria della probabilità, una variabile casuale (o variabile aleatoria o variabile stocastica o variabile random) può essere pensata come il risultato numerico di un esperimento quando questo non è prevedibile con certezza (ossia non è deterministico). Ad esempio, il risultato del lancio di un dado a sei facce può essere matematicamente modellizzato come una variabile casuale che può assumere uno dei sei possibili valori .
Bruno de Finetti definiva numero aleatorio (termine suggerito dallo stesso per denotare la variabile casuale) un numero ben determinato ma non noto per carenza di informazioni.
Più formalmente, dato uno spazio campionario Ω su cui è definita una misura di probabilità ν una variabile casuale è una funzione misurabile dallo spazio campionario allo spazio euclideo dove, secondo la definizione di Lindgren (1976): una funzione X definita sullo spazio campionario Ω si dice misurabile rispetto al campo di Borel se e solo se l'evento
appartiene a
per ogni λ.
- Le variabili casuali a una dimensione si dicono semplici o univariate.
- Le variabili casuali a più dimensioni si dicono multiple o multivariate (doppie, triple, k-uple).
Variabili casuali che dipendono da un parametro t (t come tempo) vengono considerati dei processi stocastici.
Indice |
[modifica] Distribuzione di probabilità
Ad una variabile casuale X si associa la sua distribuzione, o legge, di probabilità PX, che assegna ad ogni sottoinsieme dell'insieme dei possibili valori di X la probabilità che la v.c. X assuma valore in esso. In formule, se X è una v.c. a valori in H e A è un sottoinsieme di H la distribuzione di probabilità di X in a A vale
dove ν è la misura di probabilità definita sullo spazio campionario.
La legge di probabilità della v.c. X è individuata univocamente dalla sua funzione di ripartizione, definita come . Inoltre:
- se la v.c. X è discreta, cioè l'insieme dei possibili valori (il rango o supporto di X) è finito o numerabile, è definita anche la funzione di probabilità o funzione di distribuzione o funzione massa di probabilità
-
- p(x) = P(X = x)
- se la v.c. X è continua, cioè l'insieme dei possibili valori ha la potenza del continuo, è definita anche la funzione di densità di probabilità, cioè la funzione f non negativa tale per cui
[modifica] Storia
Ancorché non formalizzata, il concetto della distribuzione statistica attorno ad una media era nota fin dall'antichità. Leggiamo infatti nel Fedone di Platone:
- «E non è ingiusto, questo? Non è forse vero che chi si comporta così, evidentemente vive tra gli uomini senza averne nessuna esperienza? Se, infatti, li conoscesse appena, saprebbe che son pochi quelli veramente buoni o completamente malvagi e che per la maggior parte, invece, sono dei mediocri.»
«In che senso?» feci.
«È lo stesso delle cose molto piccole e molto grandi. Credi forse che sia tanto facile trovare un uomo o un cane o un altro essere qualunque molto grande o molto piccolo o, che so io, uno molto veloce o molto lento o molto brutto o molto bello o tutto bianco o tutto nero? Non ti sei mai accorto che in tutte le cose gli estremi sono rari mentre gli aspetti intermedi sono frequenti, anzi numerosi?»
(Platone, Fedone, XXXIX)
[modifica] Alcune variabili casuali utilizzate in statistica
Le variabili casuali si dividono principalmente in due grandi classi, le discrete e le continue (o assolutamente continue):
- variabili casuali discrete, ad es.
- variabile casuale uniforme discreta
- variabile casuale bernoulliana, caso particolare della Binomiale
- variabile casuale binomiale
- variabile casuale poissoniana detta pure legge degli eventi rari
- variabile casuale geometrica o di Pascal
- variabile casuale ipergeometrica
- variabile casuale degenere
- variabili casuali continue, ad es.
- variabile casuale normale o gaussiana
- variabile casuale Gamma o Erlanghiana
- variabile casuale esponenziale negativa, caso particolare della v.c. Gamma
- variabile casuale Chi Quadrato χ², caso particolare della v.c. Gamma
- variabile casuale Beta
- variabile casuale rettangolare o uniforme continua
Tali classi non sono però esaustive della famiglia delle variabili casuali; esiste anche una terza classe, delle variabili casuali singolari o continue singolari, come la variabile casuale di Cantor.
Il teorema di rappresenzazione di Lebesgue ci assicura che ogni funzione di ripartizione (e dunque ogni variabile casuale) è rappresentabile come combinazione convessa di una funzione di ripartizione discreta, una continua e una singolare. Variabili casuali che non appartengono a nessuna delle tre classi vengono dette miste.
Si può comunque dimostrare che le classi delle v.c. discrete e delle v.c. continue sono dense nella classe di tutte le variabili casuali rispetto alla convergenza in distribuzione, cioè per ogni variabile casuale esiste una successione di v.c. discrete (rispettivamente continue) che converge in distribuzione alla variabile data.
[modifica] Teoremi
- Se
- X1, X2, ... , Xn sono v.c. Bernoulliane uguali e indipendenti
- allora
- X = X1 + X2 +...+ Xn, è una v.c. binomiale B(n;p)
- Se
- X è una variabile casuale binomiale B(n;p) con n molto grande (orientativamente n>50) e p molto piccolo, tale che n p è, orientativamente, minore di 10 e p(1-p) quasi uguale a p,
- allora
- la binomiale può essere approssimata con una variabile casuale poissoniana ove λ = n p.
- Se
- X è una variabile casuale binomiale B(n;p) con n molto grande, ma np>10 (e dunque non vale l'approssimazione con la v.c. poissoniana),
- allora
- la binomiale può essere approssimata con una variabile casuale normale con valore atteso pari a np e varianza uguale a npq: N( np ; npq).
- Se
- X e Y sono due variabili casuali indipendenti, distribuite come una variabile casuale poissoniana con parametro rispettivamente λx e λy
- allora
- Z=X+Y è a sua volta una v.c. Poissoniana con parametro λz = λx+λy
- Se
- X è una variabile casuale Beta con p=q=1
- allora
- si tratta di una v.c. rettangolare con i parametri a e b
- Se
- X e Y sono due v.c. Gamma in senso stretto (a=1) con il parametro p uguale ripettivamente a n e m
- allora
- Z=X/Y è distribuita come una v.c. Beta con i parametri p=n e q=m
- Se
- X e Y sono due v.c. identiche e indipendenti distribuite come una variabile casuale esponenziale negativa con parametro a
- allora
- Z=X+Y è una v.c. Gamma con parametri a e p=2
La v.c. esponenziale negativa viene usata in relazione alla v.c. poissoniana in quanto:
- se
- il numero di successi entro un predeterminato intervallo di tempo è distribuito come una Poissoniana (con parametro λ),
- allora
- l'intervallo di tempo che passa tra due successi è distribuito come una Esponenziale Negativa con a=λ
e viceversa.
- Se
- X1, X2, ..., Xn sono n v.c. χ² tra di loro indipendenti, ciascuna con gi gradi di libertà,
- allora
- la v.c. Y = X1 + X2 + ... + Xn è a sua volta una v.c. χ² con g gradi di libertà, ove g = g1 + g2 + ... + gn
- Se
- Z è una v.c. normale standardizzata N(0,1), e X=Z²
- allora
- X è una v.c. χ² con 1 grado di libertà.
Considerato un campione di n elementi estratto da una popolazione normale Z(μ;σ²) indicando con S² la distribuzione della varianza campionaria sarà:
(n S²/σ² ) ~ χ²n-1
- Se
- X è una v.c. t di Student e g → +∞
- allora
- X tende ad una v.c. normale standardizzata (μ=0 e σ²=1)
- Se
- Z~N(0;1) e X~χ²g,
- allora
- T=Z/√X/g è distribuita come una v.c. t di Student con g gradi di libertà.
- Se
- X è una v.c. t di Student con g=1
- allora
- si ottiene la v.c. di Cauchy.
variabile casuale F di Snedecor:
- Se
- il secondo grado di libertà è molto grande,
- allora
- la F di Snedecor tende verso una v.c. Gamma con a=p=g/2
- Se
- entrambi i gradi di libertà sono molto grandi,
- allora
- si può usare la Normale
- Se
- il primo grado di libertà è pari ad uno,
- allora
- si può usare la v.c. t di Student
- Se
- Xg1 e Xg2 sono v.c. Chi Quadrato con rispettivamente g1 e g2 gradi di libertà
- allora
- Y = [Xg1/g1] / [Xg2/g2] è distribuita come una variabile casuale F di Snedecor con g1 e g2 gradi di liberta;
- Se
- in un processo markoviano (continuo nel tempo) nascite-morti, con le condizioni iniziali Pn(0)=1 per n=0, e =0 altrimenti, si osserva un processo di pure nascite con tasso costante λ
- allora
- si ottiene la soluzione Pn(t)=e-λt (λt)k/k!, ovvero una variabile casuale poissoniana con parametro λt