Il modello OLS: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Nessun oggetto della modifica
Riga 16:
* i vari <math>\beta</math> che sono '''parametri''' costanti '''oggetto della nostra stima OLS''';
* <math>u_i</math> è '''l'errore''' associato, cioè quella parte di <math>Y</math> che è incorrelata con <math>X</math> e che '''non so spiegare'''.
Naturalmente non sappiamo quali siano <math>\beta_0</math> e <math>\beta_1</math>, e dobbiamo stimarli attraverso dati campionari e opportuni '''stimatori''' (che in questa lezione sono appunto gli stimatori OLS). Trovati delle stime di <math>\beta_0</math> e <math>\beta_1</math>, che chiamiamo <math>\hat{\beta_0}</math> e <math>\hat{\beta}_1</math>, abbiamo la stima di <math>y_i</math> che chiamiamo <math>\hat{y}_i</math> e anche una la stima degli errori, cioè i '''residui''' <math>\hat{u}_i=y_i-\hat{y}_i=y_i-\hat{\beta}_0-\hat{\beta}_1 x_i</math> che banalmente rappresentano quanto la retta di regressione non è stata capace di spiegare.
 
== Stimatori OLS ==
Gli stimatori OLS sono variabili casuali <math>\hat{\beta}_0</math> e <math>\hat{\beta}_1</math> tali che la somma degli ''i'' residui è minimizzata.
 
<math display="block">\hat{\beta}_1=\frac{\text{Cov}(X,Y)}{\text{Var}(X)}=\frac{\sum_{i=1}^n (x_i-\bar{X})(y_i-\bar{Y})}{\sum_{i=1}^n (x-\bar{X})^2}</math><math display="block">\hat{\beta}_0 = \bar{Y}-\hat{\beta}_1 \bar{X}</math>Se valgono le condizioni sotto, allora i due stimatori OLS sono i migliori stimatori lineari non distorti (Best Linear Unbiased Estimator).
==Assunzioni degli OLS==
 
=== Distribuzione degli OLS ===
A prescindere dalla forma delle popolazioni, per campioni sufficientemente grandi gli stimatori OLS hanno distribuzione normale con la seguente media e varianza:
 
<math display="block">\mathbb{E}(\hat{\beta}_1)=\beta_1</math><math display="block">\text{Var}(\hat{\beta}_1)=\frac{\sigma^2_u}{n (\sigma_X^2)^2}</math>
 
==AssunzioniCondizioni degli OLS==
===Gli errori non sono correlati con la variabile esplicativa===
Se gli errori sono correlati con la variabile esplicativa <math>\hat{\beta}_0</math> e <math>\hat{\beta}_1</math> sono distorti, cioè <math>\mathbb{E}(\hat{\beta}_i) \neq \beta_i</math>.
 
=== La variabile dipendente e le variabili esplicative indipendenti e identicamente distribuite ===
Gli elementi estratti di <math>X</math> devono appartenere alla medesima popolazione, cioè una popolazione avente media <math>\mu_X</math> e varianza <math>\sigma^2_X</math>, e la medesima cosa vale per <math>Y</math>. Se le variabili non appartengono alla medesima distribuzione, allora gli OLS potrebbero essere distorti, inefficienti o anche privi di senso. Per esempio i dati della variabile esplicativa potrebbero essere presi da due popolazioni aventi diversa media e varianza, oppure solo diversa varianza (eteroschedasticità).
 
Inoltre l'estrazione di un elemento della popolazione <math>x_i</math> deve essere del tutto casuale e non dipendente dall'estrazione (o dalla non estrazione) di un altro elemento <math>x_j</math>, e la medesima cosa vale per <math>Y</math>.
 
=== Outlier rari e improbabili ===
Un '''outlier''' è una osservazione ''anomala'', o meglio, ''sospetta'', che potrebbe celare un errore di battitura o comunque una situazione particolare che non merita di essere considerata e di influenzare l'intera analisi. Formalmente la '''curtosi''' della distribuzione della variabile deve essere ''finita'' e ''non nulla'', dunque:
 
<math display="block">0<\mathbb{E}(X^4)<+\infty</math>In realtà spesso gli outlier sono riconoscibili anche graficamente nello scatter plot.
[[Categoria:Econometria|Il modello OLS]]