Il modello OLS: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Creata pagina con "{{Templatedanielg |avanzamento=00 |materia1=Econometria |precedente1= |successivo1= }} Supponiamo di avere disposizioni dati campionari relativi a due fenomeni: ''salario men..."
 
Nessun oggetto della modifica
Riga 7:
 
Supponiamo di avere disposizioni dati campionari relativi a due fenomeni: ''salario mensile'', che chiamiamo <math>Y</math>, e ''anni di istruzione'', che chiamiamo <math>X</math>. Potremmo essere interessati a sapere se è vero che "studiare di più serve a guadagnare di più in futuro", e cercare di scoprire anche "quanto". In altri termini, cerchiamo una funzione che associa a ogni quantità di anni impiegati nello studio una '''previsione''' il più precisa possibile di quello è lecito aspettarsi di guadagnare in futuro, non sulla base di teorie ma a partire da dati campionari raccolti.
[[File:Scatter-anni-stipendio.png|centre|thumb|640x640px|Stipendio guadagnato in relazione agli anni di istruzione]]
Dal grafico di esempio e dal buon senso è lecito aspettarsi una qualche correlazione positiva tra anni di istruzione e stipendio guadagnato.
 
Per "previsione il più precisa possibile" in questa sede intendiamo una '''retta''' che '''minimizza gli errori di previsione'''. Nel caso di funzioni lineari, come quelle a cui facciamo riferimento in questa lezione, il modello OLS è dunque così composto:<center><math>y_i=\beta_0+\beta_1 x_i+u_i</math></center>
<center><math>y_i=\beta_0+\beta_1 x_{1,i}+\beta_2 x_{2,i}+\ldots+\beta_n x_{n,i}+u_i</math></center>
dove:
* <math>y_i</math> è l'i-esimaesimo osservazionelivello della variabile <math>Y</math>, che è il fenomeno che vogliamo spiegare;
* <math>x_i</math> è l'i-esimaesimo osservazionelivello della variabile <math>X</math>, che è il fenomeno che "usiamo" per spiegare <math>Y</math> poiché lo riteniamo ad esso in qualche modo correlato;
* i vari <math>\beta</math> che sono '''parametri''' costanti '''oggetto della nostra stima OLS''';
* <math>u_i</math> è '''l'errore''' associato alla retta di regressione, cioè quella parte di <math>Y</math> che è incorrelata con <math>X</math> e che '''non so spiegare'''.
Naturalmente non sappiamo quali siano <math>\beta_0</math> e <math>\beta_1</math>, e dobbiamo stimarli attraverso dati campionari e opportuni '''stimatori''' (che in questa lezione sono appunto gli stimatori OLS). Trovati delle stime di <math>\beta_0</math> e <math>\beta_1</math>, che chiamiamo <math>\hat{\beta_0}</math> e <math>\hat{\beta}_1</math>, abbiamo anche una la stima degli errori, cioè i '''residui''' <math>\hat{u}_i=y_i-\hat{\beta}_0-\hat{\beta}_1 x_i</math> che banalmente rappresentano quanto la retta di regressione non è stata capace di spiegare.
 
== Stimatori OLS ==
Gli stimatori OLS sono variabili casuali <math>\hat{\beta}_0</math> e <math>\hat{\beta}_1</math> tali che la somma degli ''i'' residui è minimizzata.
 
==Assunzioni degli OLS==
===Gli errori non sono correlati con la variabile esplicativa===
 
 
 
 
 
[[Categoria:Econometria|Il modello OLS]]