Questa pagina deve essere wikificata, cioè formattata secondo gli standard di Wikiversità.
Collabora anche tu a renderla conforme alle convenzioni (vedi anche qui), poi rimuovi questo avviso.
Le variabili casuali sono funzioni che permettono di associare un numero al risultato di un esperimento. Questo viene fatto per riportare tutto in uno spazio matematico, in cui poter usare tutti gli strumenti matematici noti.
Consideriamo come esempio il caso in cui si vuole monitorare l'apertura e la chiusura di 100 porte di un centro commerciale. Se vediamo lo spazio di probabilità classico, avremo, considerando una sola porta, . Queste porte potrebbero essere indipendenti.
Considerando lo spazio a 100 dimensioni,
Se voglio solo conoscere il numero medio di aperture, basta definire una funzione, la nostra variabile casuale, che, dato il vettore di 100 elementi, ci restituisce il numero di porte aperte. Abbiamo spostato il problema da uno spazio complicato a dei semplici valori in di solito, in questo caso in .
Definizione: Funzione misurabile
Dati due spazi misurabili e , una funzione
si dice misurabile se , la controimmagine di attraverso appartiene ad .
Un boreliano è ad esempio un insieme della forma con . La condizione di misurabilità
consente di attribuire una probabilità agli eventi specificati dai valori assunti dalla variabile casuale.
Esempi:
Questo perché va inteso come
e la condizione di misurabilità di sommato al fatto che è un boreliano assicurano che sia un evento in . Allora, si potrà scrivere che
Questo è ben definito, perché
.
Se la funzione misurabile è effettivamente una variabile casuale, per ogni evento nello spazio di arrivo possiamo trovare una controimmagine nello spazio di probabilità originario. Nella controimmagine abbiamo definito la probabilità, quindi è possibile trovare sempre un valore di probabilità associato al valore della variabile casuale e viceversa.
Quello che non deve succedere è che, tornando indietro, venga generata una controimmagine che non appartiene ad .
Dato lo spazio di probabilità , consideriamo l'evento come l'unico evento che ci interessa. Definita la funzione indicatrice
come
Verifichiamo che è una variabile casuale.
Consideriamo il generico boreliano e determiniamo la controimmagine data da . Graficamente...
Avremo che
è indicata anche come ed è detta funzione indicatrice dell'evento A.
A conclusione di questo, dato che
allora è una variabile casuale.
Notare che l'immagine di attraverso è un insieme finito, quindi è una variabile casuale discreta.
Esempio: Lancio una moneta
con
Consideriamo X come:
Come si può verificare che definita su uno spazio di probabilità sia una variabile casuale? La verifica basata sulla definizione appena vista è onerosa, perché bisogna considerare tutti i boreliani e calcolare le controimmagini attraverso , verificando che appartengano a .
Il seguente lemma permette di restringere la verifica ad un sottoinsieme di boreliani.
Lemma:
Sia una collezione di insiemi in tali che . Dato lo spazio di probabilità , condizione necessaria sufficiente affinché sia una variabile casuale è che
Se uno spazio è discreto, basta definire le probabilità sugli eventi elementari della -algebra. Se è continuo, è impossibile definire le probabilità per ogni elemento della -algebra. Avevamo definito una probabilità su un'algebra che ci permette di generare la -algebra di interesse, in modo tale da estendere la misura di probabilità alla -algebra. La stessa cosa accade qui: andiamo a trovare la controimmagine per un sottoinsieme di boreliani, e possiamo poi estendere a tutti gli eventi che sono nell'insieme boreliano. È la stessa cosa. Usiamo la funzione X per generare il nostro sottoinsieme di eventi, verifichiamo che esistano le controimmagini sul sottoinsieme definito ed abbiamo finito.
Abbiamo visto che può essere costruita come la più piccola -algebra che contiene insiemi del tipo . Dati quindi e , è una variabile casuale se
Esempio:
Esercizio: Esercizio per lo studente
Dato , verificare che è una variabile casuale, usando quest'ultimo metodo.
Aprire il cassetto sottostante per visualizzare la soluzione dell'esercizio.
Soluzione
Attenzione: questa è soltanto una traccia di soluzione.
Se abbiamo una variabile casuale n-dimensionale, allora abbiamo n variabili casuali e viceversa. Questo non vuol dire che se abbiamo la densità congiunta di due variabili casuali possiamo verificare l'indipendenza: bisogna prima calcolare le marginali e lavorare su quelle.
Teorema:
Consideriamo la variabile casuale n-dimensionale X su
misurabile da a , X ha n componenti lungo gli assi coordinati
con
allora ogni componente è una variabile casuale.
Dimostrazione:
Sia . Dimostriamo che
Vale
Questo è vero se e solo se
Da cui si deve avere
cioè
da cui segue la tesi.
Dimostrazione del viceversa:
Se consideriamo n variabili casuali
definite su
misurabili da a , allora il vettore
è una variabile casuale n-dimensionale. Questa verifica è banale ed è lasciata per esercizio.
Definizione: Distribuzione di una variabile casuale
Dato , sia una variabile casuale, . Si defisce funzione di distribuzione della variabile casuale
data da
È esattamente la stessa cosa che avevamo fatto per la funzione di distribuzione delle distribuzioni di probabilità.
Nella maggior parte dei casi la si definisce direttamente nella definizione di variabile casuale.
La distribuzione di probabilità soddisfa le seguenti proprietà:
è non decrescente
, cioè è continua a destra;
ammette limite sinistro, ossia
Tutte le funzioni che soddisfano queste proprietà sono funzioni di distribuzione della variabile casuale .
Abbiamo visto che ad ogni funzione di distribuzione su è associata una ed una sola misura di probabilità che soddisfa . Per estensione, indichiamo con la misura di probabilità associata alla ,
è la misura di probabilità su tale che
Proprietà di e :
Teorema: Teorema di esistenza della variabile casuale
Data una funzione di distribuzione su , si può definire su una misura di probabilità e su una variabile casuale che ammette come funzione di distribuzione.
Dimostrazione:
Sia la misura di probabilità su tale che
Sappiamo che essa esiste ed è unica. Definiamo
come
X è una variabile casuale su ; inoltre,
Definizione: Funzione di distribuzione continua
Ad posso associare spazio di probabilità con
.
Sappiamo che tale esiste ed è unica. Allora è una variabile casuale che ammette come distribuzione.
Definizione: Funzione di densità di probabilità continua
Sia uno spazio di probabilità . Se esiste una funzione tale che
allora è detta assolutamente continua ed è detta funzione di densità di probabilità (pdf).
Consideriamo l'evento
Solitamente, si caratterizza la variabile casuale X indicando la densità di probabilità.
Definizione: Variabile casuale uniforme
Una variabile casuale uniforme è uniformemente distribuita in e vale
Definizione: Variabile casuale gaussiana
La variabile casuale gaussiana è
con . Si ha
con
Definizione: Variabile casuale Q(x)
è la coda della gaussiana, usata per calcolare le probabilità di errore.
Definizione: Funzione di distribuzione discreta
La funzione di distribuzione discreta è una costante a tratti, con:
In questo caso conviene introdurre
Consideriamo lo spazio e definiamo la funzione
è una variabile casuale discreta con funzione di distribuzione
A questo punto, possiamo scrivere che
Esempio:
Banalmente, se avete il lancio di una moneta:
con
Allora la funzione di distribuzione è
Esercizio:
Dato lo spazio di probabilità , lancio di un dado non truccato, con , considerare la seguente variabile casuale e caratterizzarla:
>x=[-10:0.001:10];>lambda=1;% valore scelto arbitrariamente>f_x=lambda/2.*exp(-lambda.*abs(x));>plot(x,f_x)
Esempio: La codifica predittiva
La codifica predittiva utilizza parecchio la variabile casuale di Laplace. Si vuole comprimere un video, una serie di fotogrammi
In generale, la funzione di densità di probabilità dei pixel sarà uniforme; al contrario, però, la funzione di densità di probabilità di
sarà del tipo di Laplace. La funzione è detta il predittore: migliore è il predittore, più i valori si concentrano attorno allo zero con distribuzione di Laplace.
Sono le variabili casuali le cui densità di probabilità si possono scrivere come combianzione lineare di gaussiane pesate.
Esempio:
Abbiamo due contenitori di gas e , collegati tra loro da un tubo con rubinetto. I due gas sono a pressioni diverse. L'energia delle molecole dei due contenitori è distribuita secondo due gaussiane,
Aprendo il rubinetto, la densità di probabilità dell'energia delle molecole sarà una combinazione delle due gaussiane, quindi una mixtura gaussiana.
Esempio: Query by sample
Abbiamo tante immagini in un database e vogliamo cercare quelle che sono simili ad un'immagine di esempio. Quello che si può fare per confrontare queste immagini è usare l'istogramma del colore, indipendente dalle dimensioni delle immagini e che è rappresentabile come somma di un certo numero di gaussiane. Se per esempio rappresento l'istogramma con 4 gaussiane, con 8 numeri sono in grado di rappresentare immagini magari di punti, su cui fare calcoli di distanza sarebbe un lavoro molto oneroso.