Distribuzione e densità condizionata
Distribuzione condizionata
modifica
definita come
dove
Nota: può essere vista come la funzione di distribuzione definita su con .
tale che
con gli disgiunti a coppie. Allora, la probabilità dell'evento
è data da
ossia
Se poi la variabile casuale ammette densità, allora si ha
si ha
dove
In generale, per determinare la si deve conoscere lo spazio di probabilità su cui è definita la variabile casuale , dal momento che bisogna calcolare la probabilità
con . Se però è espresso in funzione di , per esempio
allora la può essere calcolata a partire da .
Allora, si ha
Si ha
Se la ammette anche densità, allora
Valore atteso condizionato ad un evento
modificaSiano con e con . Data la variabile casuale definita su che ammette densità condizionata , allora
Se esiste una funzione per cui , con funzione di Borel, allora si ha
Vediamo ora come è possibile calcolare la probabilità di un evento, condizionata ad una variabile casuale. Se si ha come variabile casuale discreta, si ha
con . Se è una variabile casuale continua, al contrario, si ha che ; osserviamo che vale
La probabilità di un evento condizionata a è definita come quella funzione
tale per cui
La grandezza può essere calcolata da
Se l'evento è tutto , allora si ha
Densità condizionata di variabile casuale, data un'altra variabile casuale
modificaSappiamo calcolare la probabilità
come un caso particolare di . In altri termini, si ha
Questa è la funzione di distribuzione (se ) perché la funzione
definita da
è una misura di probabilità se esiste la funzione di densità di probabilità tale per cui
Questo risultato assomiglia alla probabilità condizionata di un evento, che è
con dato dalla proposizione precedente.
Si ha
Osservazioni:
- è la sezione di con il piano ;
- se e sono variabili casuali indipendenti, allora si ha
- Infatti, se le due variabili sono indipendenti, la conoscenza di non è in alcun mondo influenzata dalla conoscenza di .
Valore atteso condizionato
modifica
Anche qui, vale il teorema del valore atteso che dice che, data una variabile casuale , si ha
- Se le variabili casuali e sono indipendenti, allora , da cui si ha
- Se , allora si ha dipendenza totale e vale
- Questo è abbastanza intuitivo: se si ha dipendenza completa , allora vale
- cioè, si ha una quando , non si ha alcuna incertezza sul risultato.
- Se poi è separabile, cioè
- allora si ha
Consideriamo il solito spazio di probabilità con le variabili casuali e con un'altra variabile casuale tale che
La variabile casuale ha un valore atteso condizionato; in generale, la variabile casuale rappresenta il valore atteso condizionato
Applicando il teorema del valore atteso, si ha
Stima con la massima probabilità a posteriori (MPP) e con la massima verosimiglianza (MV)
modificaDato lo spazio di probabilità con e , si definisce la variabile casuale
Quello che vogliamo fare è, dato , capire a quale delle due popolazioni oppure appartiene. Se si prende l'esempio delle molecole di gas, la funzione di densità di probabilità dell'energia è una combinazione lineare di altre funzioni di densità di probabilità; qui è la stessa cosa, si vuole calcolare la densità di uscita come mixture di altre densità.
I simboli di partenza possono essere oppure , il rumore è di tipo gaussiano e la variabile casuale di interesse è la di uscita. Se si trasmette il segnale , la funzione di densità di probabilità sarà la ; al contrario, se si trasmette , allora la densità sarà .
Si ha
Massima probabilità a posteriori
modificaLa massima probabilità a posteriori è definita come
Se vale , allora decidiamo che è stato trasmesso e non .
Il criterio a massima probabilità a posteriori, quindi, è
Massima verosimiglianza
modificaNel caso in cui , il criterio di massima probabilità a posteriori diventa un criterio di massima verosimiglianza.
Il criterio a massima verosimiglianza è meno potente di quello a massima probabilità a posteriori, perché quest'ultimo sfrutta la conoscenza della probabilità dei simboli prima di essere trasmessi, mentre il secondo metodo si limita ad osservare il risultato finale e la funzione di densità di probabilità, considerando tutti i simboli equiprobabili. Quindi, il criterio a massima verosimiglianza è meno potente, perché sfrutta meno informazioni.