In teoria della probabilità e statistica, ci sono parecchie formule computazionali per la varianza che permettono di ottenere la varianza di una variabile casuale. La loro utilità dipende da ciò che è già noto sulla variabile casuale; per esempio, una variabile casuale può essere definita in termini della sua funzione di densità di probabilità o per costruzione da altre variabili casuali. In questo contesto, intendiamo ottenere espressioni algebriche per la varianza teorica di una variabile casuale, differentemente dalle questioni di stimare la varianza di una popolazione da dati campione per i quali ci sono speciali considerazioni per l'implementazione di algoritmi di calcolo.
Esiste una formula corrispondente da utilizzare per la stima della varianza da dati campione, che può essere utile nei calcoli manuali. Si tratta di un'identità strettamente correlata che è strutturata per creare una stima priva di bias della varianza della popolazione
L'uso di queste formule può tuttavia essere sconveniente nella pratica quando si utilizza l'aritmetica in virgola mobile con precisione limitata: la sottrazione tra due valori di grandezza analoga può portare a una cancellazione catastrofica,[3] e causare così una perdita di significato quando .
Esistono altri algoritmi per il calcolo della varianzanumericamente stabili per l'uso con l'aritmetica in virgola mobile.
Dimostrazione
La formula computazionale per la varianza della popolazione segue in maniera diretta dalla proprietà di linearità dei valori attesi e dalla definizione di varianza:
dove le aspettazioni sono prese elemento per elemento e e sono vettori casuali di lunghezze rispettive e .
Notare che questa formula soffre della stessa perdita di significato di cui soffre la formula per la varianza se usata per calcolare stime della covarianza.
^(FR) formule di Koenig–Huygens. Consultare, per esempio, Jean-Jacques Martiano, Maths: prépas commerciales, Studyrama, 2006, p. 148, ISBN978-2-84472-828-9.