Il metodo dei minimi quadrati generalizzati di Aitken consente la stima di un modello lineare, sotto ipotesi più generali di quelle del modello classico di regressione lineare multivariata.
Perché ipotesi più generali?
[modifica | modifica wikitesto]Sulla base del criterio del rasoio di Occam, formulare ipotesi più generali pone un costo in termini di trattabilità di un modello perciò generalmente si preferisce non sacrificare la semplicità e l'eleganza del modello classico di regressione lineare, ponendo ipotesi più generali. In altri casi come nei seguenti esempi esistono fondati motivi che rendono necessario formulare ipotesi meno restrittive.
- Sull'assenza/presenza di correlazione nei disturbi: nell'ambito dell'analisi di serie storiche di dati è lecito attendersi che sussista una qualche relazione tra osservazioni effettuate in istanti successivi; per esempio: l'evoluzione della natalità in una data area geografica, l'andamento nel tempo di un segnale elettrico o dei rendimenti di un titolo azionario;
- Sulla omoschedasticità/eteroschedasticità dei disturbi: laddove si campionino unità statistiche intrinsecamente eterogenee è lecito attendersi che la varianza del disturbo possa variare da osservazione a osservazione; per esempio: l'analisi dei consumi di un campione di famiglie o della produzione di un campione di imprese, lo studio dell'incidenza di una malattia geneticamente trasmissibile in un campione di regioni.
Limiti del modello classico di regressione lineare
[modifica | modifica wikitesto]Il modello classico di regressione lineare impone ipotesi relativamente restrittive sulla struttura della matrice varianze-covarianze dei disturbi del modello:
In particolare, si assume che i disturbi abbiano valore atteso nullo: , nonché si ipotizzano:
- Assenza di correlazione: ;
- Omoschedasticità: ;
queste ipotesi possono essere scritte sinteticamente, in notazione matriciale, come:
dove denota una matrice identità di opportuno ordine. Si consideri una struttura più generale, del tipo:
dove è una matrice definita positiva simmetrica qualsiasi. Ciò significa ammettere la possibilità di correlazione dei disturbi ed eteroschedasticità. Si consideri quindi lo stimatore dei minimi quadrati ordinari (OLS, dall'inglese Ordinary Least Squares) derivato nel contesto del modello classico di regressione lineare:
Si vogliono valutare le proprietà statistiche di sotto le ipotesi più generali testé esposte. Lo stimatore gode ancora della proprietà di correttezza:
Quanto alla matrice varianze-covarianze di , si ha:
Si ricorda che la matrice varianze-covarianze di , sotto le ipotesi del modello classico di regressione lineare, è data da . In generale, non è possibile stabilire se sia maggiore o minore di (ad esempio, nel senso del teorema di Gauss-Markov), in quanto ciò dipende da , che in generale non è nota. È tuttavia lecito aspettarsi che lo stimatore non sia, in questo caso, ottimale nel senso stabilito dal teorema di Gauss-Markov sotto le ipotesi del modello classico.
Stimatore dei minimi quadrati generalizzati
[modifica | modifica wikitesto]Sotto le ipotesi generali sopra enunciate è possibile dimostrare che lo stimatore ottimale è lo stimatore dei minimi quadrati generalizzati (o GLS, dall'inglese Generalised Least Squares) di Aitken:
Euristicamente si può affermare che, per effetto dei termini nell'espressione sopra, lo stimatore assegna un peso maggiore alle osservazioni caratterizzate da una minore varianza che sono dunque da considerarsi più "affidabili".
Derivazione dello stimatore GLS
[modifica | modifica wikitesto]Lo stimatore può essere interpretato come uno stimatore OLS basato su variabili trasformate. Si ipotizzi infatti che esista una matrice non singolare tale che:
così che . Moltiplicando ambo i membri di per si ha il modello nelle variabili trasformate:
Si osserva immediatamente che:
Il modello nelle variabili trasformate verifica dunque le ipotesi del modello lineare classico. Si fa dunque ricorso allo stimatore OLS:
Quest'ultima espressione altro non è che lo stimatore GLS o dei minimi quadrati generalizzati.
Proprietà dello stimatore GLS
[modifica | modifica wikitesto]Lo stimatore gode, così come , della proprietà di correttezza:
La sua matrice varianze-covarianze è inoltre data da:
Il teorema di Aitken stabilisce che lo stimatore è, nella classe degli stimatori lineari per il modello di regressione generalizzato sulla base delle ipotesi sopra, quello caratterizzato dalla minima varianza in questo senso lo stimatore GLS è uno stimatore efficiente.
Utilizzo dello stimatore GLS
[modifica | modifica wikitesto]Nelle applicazioni in generale la matrice varianze-covarianze non è nota, per cui lo stimatore GLS non è direttamente utilizzabile, almeno nella forma in cui è presentato sopra.
La conoscenza del particolare fenomeno oggetto di studio può tuttavia suggerire al ricercatore indizi circa la struttura di . Per esempio il ricercatore potrà aspettarsi soltanto eteroschedasticità o correlazione nei disturbi, o entrambe. Questa conoscenza del fenomeno, eventualmente unita a un'analisi delle cause dei disturbi, consente di individuare un opportuno stimatore della matrice varianze-covarianze, . In genere si ricerca uno stimatore che goda della proprietà di consistenza, ossia tale per cui:
dove indica il numero di osservazioni e denota la convergenza in probabilità, e
In tal caso, lo stimatore dei minimi quadrati generalizzati è detto, con voce inglese, stimatore dei Feasible Generalised Least Squares, ed è dato da:
Le proprietà di sono analoghe a quelle di e , tuttavia hanno natura asintotica.
Bibliografia
[modifica | modifica wikitesto]- Aitken, A.C. (1935), On Least Squares and Linear Combinations of Observations, Proceedings of the Royal Statistical Society 55, 42-48; il contributo originale di Aitken;
- Davidson, J. (2000), Econometric Theory, Blackwell, ISBN 0-631-21584-0, un testo specializzato in econometria, di livello master/dottorato; esamina rigorosamente gli aspetti algebrici del metodo di Aitken (in inglese);
- Greene, W.H. (2000), Econometric Analysis, Prentice-Hall, ISBN 0-13-013297-7, ancora un testo di econometria, propone il metodo dei minimi quadrati generalizzati nel contesto di un'analisi del modello di regressione lineare di più ampio respiro (in inglese).