Istogrammi
L'istogramma è un particolare diagramma cartesiano che ha valori discreti sulle ascisse e una grandezza sulle ordinate rappresentata dall'altezza di una colonna, che chiamiamo bin. In fisica gli istogrammi ci permettono di studiare i risultati di un esperimento, poiché ci fornisce una indicazione grafica di come siano distribuiti dei conteggi o delle frequenze in funzione dei valori discreti presi in considerazione.
Per costruire un istogramma vi sono delle scelte importanti:
- Prima di tutto bisogna decidere di prove.
- Poi bisogna scegliere il binning, ovvero la divisione del dominio della variabile sulle ascisse in intervalli. Definiamo dunque intervalli, dove il -esimo bin sarà largo .
- Infine dobbiamo conteggiare le occorrenze da associare ai singoli bin.
Vediamo ora un caso particolare che riguarda le prove ripetute.
Misure ripetute
modificaGli istogrammi sono particolarmente utili quanto vogliamo sintetizzare, ad esempio, i risultati di una prova ripetuta. Supponiamo di eseguire misure ripetute di una grandezza costante nel tempo, ciascuna etichettata con un indice . Abbiamo due casi:
- Le misure cadono all'interno dell'intervallo di risoluzione : esprimiamo l'incertezza associata alla misura come errore associato alla risoluzione, ovvero .
- Le misure cadono al di fuori dell'intervallo di risoluzione : le misure fluttuano a causa dell'effetto di varie sorgenti, ciascuna indipendente dall'altra nella singola misura. Allora la misura è affetta da fluttuazioni casuali, e possiamo quantitativamente esprimere tale incertezza usando le proprietà della distribuzione dei campioni. Per fare ciò studiamo la forma dell'istogramma sperimentale. Il fatto che nelle prove ripetute, sotto certe condizioni, possa prendere parametri statistici campionari come e è dovuto al Teorema Centrale del Limite.
Nel secondo caso dunque scegliamo di rappresentare i dati raccolti su un istogramma. Nel caso delle prove ripetute conviene utilizzare come larghezza del bin la risoluzione della misura che stiamo effettuando: . Sulle ordinate possiamo scegliere di rappresentare tre grandezze diverse, a seconda di quali risultati vogliamo evidenziare.
Istogrammi dei conteggi
modificaNegli istogrammi dei conteggi rappresentiamo il conteggio campionario sulle ordinate. Vale la condizione di normalizzazione:
- .
Non possiamo confrontare più istogrammi di questo tipo, a meno che non siano identici il numero totale dei conteggi e la scelta dei bin .
Istogrammi normalizzati in altezza
modificaNegli istogrammi normalizzati in altezza rappresentiamo la frequenza campionaria
sulle ordinate. Essa è una grandezza adimensionale. Il profilo degli istogrammi rimane invariato rispetto a quelli dei conteggi. Vale la condizione di normalizzazione:
- .
Possiamo confrontare istogrammi di questo genere purché la scelta dei bin sia la stessa.
Istogrammi normalizzati per area
modificaLa densità campionaria è la frequenza campionaria per unità di :
- .
Essa ha le dimensioni del reciproco di . Vale la condizione di normalizzazione:
- ,
e questo ci dice che la superficie sottesa dal grafico è unitaria. Possiamo confrontare gli istogrammi normalizzato per area tra di loro, oppure anche con una probability mass function di variabili aleatorie discrete o una probability density function di variabili aleatorie continue.
Scelta del binning
modificaPer rappresentare in modo chiaro ed efficace un risultato sperimentale è di fondamentale importanza scegliere correttamente il binning. Infatti a seconda di tale scelta potremmo avere un istogramma poco definito oppure un istogramma poco significativo.
- Se l'incertezza relativa sul bin è troppo grande, ovvero è circa unitaria, siamo costretti ad accorparlo al bin adiacente. Perdiamo informazioni rispetto alla tabella dei dati, ma talvolta è necessario fare ciò;
- se il bin è troppo largo si perdono le caratteristiche della distribuzione;
- se il bin è troppo stretto abbiamo un'incertezza sulla forma, e dunque abbiamo alcuni bin che ricadono nel primo caso;
- il buon compromesso è l'istogramma in cui si risolvono i picchi senza avere incertezze sulla forma, e possiamo dimostrare dalle proprietà della distribuzione binomiale che quantitativamente ciò comporta avere un numero di bin , poiché l'incertezza su è per grande.
Parametri statistici dell'istogramma
modificaA questo punto l'istogramma ci fornisce delle preziose informazioni. Infatti studiandone la forma possiamo condensare i risultati ottenuti in due soli parametri, uno di posizione e l'altro di dispersione.
Parametro di posizione
modificaLa stima migliore e più usata come parametro di posizione di un istogramma è data dalla media campionaria , data dalla media aritmetica degli valori .
- .
La seconda espressione della media campionaria, che usa la frequenza, si ricava applicando il fattore ad ogni termine della sommatoria ed impiegando la definizione di frequenza campionaria. Si noti che la sommatoria della seconda espressione è sugli indice sui bin che vanno a numero di bin, mentre la prima è sulle indice sulle misure che vanno a numero totale di misure.
Parametro di dispersione
modificaLa dispersione è l'intervallo sulle nel quale sono distribuite le misure centrate nel suo valore più attendibile. La misura più comune della dispersione viene data dalla deviazione standard campionaria , detta anche scarto quadratico medio campionario. Essa è la radice quadrata della varianza campionaria , definita come
- .
Come misura di dispersione viene impiegata la deviazione standard campionaria poiché ha le stesse dimensioni del valore atteso e quindi possiamo esprimere la misura come un intervallo attorno al valore atteso stesso.