Distribuzione normale - Teknopedia

Technopedia Center

PMB University Brochure

Faculty of Engineering and Computer Science
S1 Informatics S1 Information Systems S1 Information Technology S1 Computer Engineering S1 Electrical Engineering S1 Civil Engineering

faculty of Economics and Business
S1 Management S1 Accountancy

Faculty of Letters and Educational Sciences
S1 English literature S1 English language education S1 Mathematics education S1 Sports Education

Distribuzione normale - Teknopedia

Variabile casuale normale (o di Gauss)
Funzione di densità La linea in rosso si riferisce alla variabile casuale normale standardizzata
Funzione di ripartizione I colori corrispondono a quelli delle densità della figura precedente
Parametri	$\mu ~\in ~\mathbb {R}$ , $\sigma ^{2}~\in ~(0,\infty )$
Supporto	$\mathbb {R}$
Funzione di densità	${\frac {1}{\sqrt {2\pi \sigma ^{2}}}}\exp \left\{-{\frac {1}{2}}\left({\frac {x-\mu }{\sigma }}\right)^{2}\right\}$
Funzione di ripartizione	${\frac {1}{2}}\left(1+\mathrm {erf} \,{\frac {x-\mu }{\sigma {\sqrt {2}}}}\right)$
Valore atteso	$\mu$
Mediana	$\mu$
Moda	$\mu$
Varianza	$\sigma ^{2}$
Indice di asimmetria	$0$
Curtosi	$0$
Entropia	$\ln \left(\sigma {\sqrt {2\,\pi \,e}}\right)$
Funzione generatrice dei momenti	${M_{X}(t)=\exp \left(\mu \,t+{\frac {\sigma ^{2}t^{2}}{2}}\right)}$
Funzione caratteristica	$\varphi _{X}(t)=\exp \left(\mu \,i\,t-{\frac {\sigma ^{2}t^{2}}{2}}\right)$
Manuale

La distribuzione normale (o distribuzione di Gauss dal nome del matematico tedesco Carl Friedrich Gauss, o distribuzione a Campana di Gauss), nella teoria della probabilità, è una distribuzione di probabilità continua che è spesso usata come prima approssimazione per descrivere variabili casuali a valori reali che tendono a concentrarsi attorno a un singolo valor medio.

Il grafico della funzione di densità di probabilità associata è simmetrico e ha una forma a campana, nota come "curva a campana", "curva normale", "curva gaussiana"^[1] o "curva degli errori".^[2]

Descrizione

[modifica | modifica wikitesto]

La distribuzione normale è considerata il caso base delle distribuzioni di probabilità continue a causa del suo ruolo nel teorema del limite centrale. Un insieme di valori dato potrebbe essere normale: per stabilirlo si può usare un test di normalità. Più specificamente, assumendo certe condizioni, la somma di $n$ variabili casuali con media e varianza finite tende a una distribuzione normale al tendere di $n$ all'infinito. Grazie a questo teorema, la distribuzione normale si incontra spesso nelle applicazioni pratiche, venendo usata in statistica e nelle scienze naturali e sociali^[3] come un semplice modello per fenomeni complessi.

La distribuzione normale dipende da due parametri, la media $\mu$ e la varianza $\sigma ^{2}$ , ed è indicata tradizionalmente con:

\ N(\mu ;\sigma ^{2}).

^[4]

Metodologia

[modifica | modifica wikitesto]

La distribuzione normale è caratterizzata dalla seguente funzione di densità di probabilità, cui spesso si fa riferimento con la dizione curva di Gauss o gaussiana:

f(x)={\frac {1}{\sqrt {2\pi \sigma ^{2}}}}\;e^{-{\frac {\left(x-\mu \right)^{2}}{2\sigma ^{2}}}}~{\mbox{ con }}~x\in \mathbb {R} ,

dove $\mu$ è il valore atteso e $\sigma ^{2}$ la varianza.

Per dimostrare che $p_{X}(x)$ è effettivamente una funzione di densità di probabilità si ricorre innanzi tutto alla standardizzazione (statistica) della variabile casuale, cioè alla trasformazione tale per cui risulta:

Z={\frac {x-\mu }{\sigma }},

dove la variabile risultante $-\infty <Z<+\infty$ ha anch'essa distribuzione normale con parametri $\mu =0$ e $\sigma =1$ . L'integrale della funzione di densità di probabilità della variabile casuale standardizzata $Z$ è il seguente:

S=\int _{-\infty }^{+\infty }p_{Z}(z)dz=\int _{-\infty }^{+\infty }{\frac {1}{\sqrt {2\pi }}}e^{-{\frac {z^{2}}{2}}}dz.

Dato che deve necessariamente valere la condizione $S=1$ , allora risulta anche $S^{2}=1$ , quindi:

S^{2}=\int _{-\infty }^{+\infty }p_{Z}(z)dz\int _{-\infty }^{+\infty }p_{Y}(y)dy,

S^{2}={\frac {1}{2\pi }}\int _{-\infty }^{+\infty }\int _{-\infty }^{+\infty }e^{-{\frac {z^{2}+y^{2}}{2}}}dzdy,

dove anche la variabile casuale $Y$ ha distribuzione normale standardizzata. Per risolvere questo integrale doppio si ricorre alle coordinate polari $z=\rho \cos \theta$ e $y=\rho \sin \theta$ , dove $\rho \geq 0$ e $0\leq \theta \leq 2\pi$ . La matrice jacobiana della trasformazione è

J(\rho ,\theta )=\left[{\begin{array}{cc}{\frac {\partial z}{\partial \rho }}&{\frac {\partial z}{\partial \theta }}\\\\{\frac {\partial y}{\partial \rho }}&{\frac {\partial y}{\partial \theta }}\end{array}}\right]=\left[{\begin{array}{cc}\cos \theta &-\rho \sin \theta \\\sin \theta &\rho \cos \theta \end{array}}\right],

il cui determinante è uguale a $|J(\rho ,\theta )|=\rho (\cos ^{2}\theta +\sin ^{2}\theta )=\rho$ . Sostituendo nell'integrale di cui sopra si ottiene:

S^{2}={\frac {1}{2\pi }}\int _{0}^{+\infty }\int _{0}^{2\pi }e^{-{\frac {\rho ^{2}(\cos ^{2}\theta +\sin ^{2}\theta )}{2}}}|J(\rho ,\theta )|d\theta d\rho =\int _{0}^{+\infty }e^{-{\frac {\rho ^{2}}{2}}}\rho \ d\rho =1.

La sua funzione generatrice dei momenti è

g(x)=e^{\mu x+\sigma ^{2}{\frac {x^{2}}{2}}}.

Il valore atteso e la varianza (che sono gli unici due parametri di questa variabile casuale) sono appunto $\mu$ e $\sigma ^{2}$ .

Non essendo possibile esprimere l'integrale della $p_{X}(x)$ in forma chiusa mediante funzioni elementari, è necessario rendere disponibili in forma tabellare i valori della sua funzione di ripartizione. I più usati sono:

68,3\%=P\left\{\mu -1,00\sigma <X<\mu +1,00\sigma \right\};

95,0\%=P\left\{\mu -1,96\sigma <X<\mu +1,96\sigma \right\};

95,5\%=P\left\{\mu -2,00\sigma <X<\mu +2,00\sigma \right\};

99,0\%=P\left\{\mu -2,58\sigma <X<\mu +2,58\sigma \right\};

99,7\%=P\left\{\mu -3,00\sigma <X<\mu +3,00\sigma \right\}.

Essendo $p_{X}(x)$ una funzione simmetrica, è sufficiente conoscere la funzione di ripartizione dei valori positivi per conoscere pure quella dei valori negativi (e viceversa).

Dalla variabile casuale Normale si possono ottenere altre variabili casuali, come la t di Student, la Chi Quadrato e la F di Fisher-Snedecor, nonché le loro "varianti" non centrali (t non centrale, chi quadrato non centrale e F non centrale).

Teoremi

[modifica | modifica wikitesto]

Combinazione lineare di variabili gaussiane

[modifica | modifica wikitesto]

Se: $X_{1},\,X_{2},\,\cdots ,X_{n}$ sono $n$ variabili casuali Normali tra di loro indipendenti, ciascuna con valore atteso $\mu _{i}$ e varianza $\sigma _{i}^{2}$ ,
allora: la variabile casuale $Y=\alpha _{1}X_{1}+\alpha _{2}X_{2}+\cdots +\alpha _{n}X_{n}$ è a sua volta una variabile casuale Normale con valore atteso $\mu =\alpha _{1}\mu _{1}+\alpha _{2}\mu _{2}+\cdots +\alpha _{n}\mu _{n}$ e varianza $\sigma ^{2}=\alpha _{1}^{2}\sigma _{1}^{2}+\alpha _{2}^{2}\sigma _{2}^{2}+\cdots +\alpha _{n}^{2}\sigma _{n}^{2}$ .

Altri teoremi: teorema di Cochran.

Relazioni con altre variabili casuali

[modifica | modifica wikitesto]

La Normale come derivazione da altre voci

[modifica | modifica wikitesto]

I teoremi del limite centrale sono una famiglia di teoremi che hanno in comune l'affermazione che la somma (normalizzata) di un grande numero di variabili casuali è distribuita approssimativamente come una variabile casuale normale.

Se $X$ è distribuita come una variabile casuale binomiale con $n$ molto grande (per dare un'idea di quanto grande, possiamo dire che deve essere $n>30$ ), e approssimativamente $np>10$ , allora la binomiale può essere approssimata con una Normale con valore atteso $np$ e varianza $npq:N(np;npq)$ .

Se $X$ è distribuita come una variabile casuale poissoniana con il parametro $\lambda$ molto grande (orientativamente $\lambda >10$ ), allora la Poissoniana può essere approssimata con una Normale con valore atteso e varianza pari a $\lambda :N(\lambda ;\lambda )$ .

Variabili casuali derivate dalla Normale

[modifica | modifica wikitesto]

Date $n$ distribuzioni normali $Z_{1}(0;1);\,Z_{2}(0;1);\,\cdots \,Z_{n}(0;1)$ con media nulla e varianza unitaria indipendenti tra loro. Allora

\chi _{n}^{2}=Z_{1}^{2}+Z_{2}^{2}+\cdots +Z_{n}^{2}

è una variabile casuale chi quadro con $n$ gradi di libertà.

Siano $Z_{1},Z_{2},\cdots ,Z_{n}$ variabili casuali indipendenti distribuite come una Normale con media nulla e varianza unitaria, e siano inoltre $a_{1},a_{2},\cdots ,a_{n}$ delle costanti tali che

\lambda =\sum {a_{i}^{2}},

allora si indica con $\chi '^{2}$ la variabile casuale chi quadro non centrale con $n$ gradi di libertà costruita come

\chi '^{2}=\sum (Z_{i}+a_{i})^{2}.

Se $Z\sim N(0;1)$ e $X\sim \chi _{n}^{2}$ tra loro indipendenti, allora $T=Z/{\sqrt {X/n}}$ è distribuita come una t di Student con $n$ gradi di libertà.

Se $X_{1},X_{2},\dots ,X_{n}{\text{ i.i.d.}}\sim {\mathcal {N}}(\mu ,\sigma ^{2})$ e $\displaystyle {\bar {X}}={\frac {\sum _{i=1}^{n}X_{i}}{n}}$ è la v.c. media campionaria, mentre ${\hat {\sigma }}^{2}={\frac {\sum _{i=1}^{n}(X_{i}-{\bar {X}})^{2}}{n}}$ è la v.c. varianza campionaria non corretta, allora ${\bar {X}}\sim {\mathcal {N}}\left(\mu ,{\frac {\sigma ^{2}}{n}}\right)$ e ${\frac {n{\hat {\sigma }}^{2}}{\sigma ^{2}}}\sim \chi ^{2}(n-1)$ , inoltre ${\bar {X}}$ e ${\hat {\sigma }}^{2}$ sono indipendenti.

Se $Z\sim N(0;1)$ e $T=\beta \left({\tfrac {\alpha Z}{2}}+{\sqrt {{\tfrac {(\alpha Z)^{2}}{4}}+1}}\right)^{2}$ , allora $T$ è una v.c. di Birnbaum-Saunders con i parametri $\alpha$ e $\beta$ .

La normale nell'inferenza bayesiana

[modifica | modifica wikitesto]

Variabile casuale Gamma come priori coniugati della normale

[modifica | modifica wikitesto]

Nell'ambito dell'inferenza bayesiana si trova la seguente relazione tra la normale e la distribuzione Gamma.

Se $x$ è una distribuzione normale con parametri $\mu$ e $1/\theta$

f(x|\theta )=N(x|\mu ;1/\theta )

e il parametro $\theta$ ha una distribuzione $\Gamma$ con i parametri $a$ e $b$

g(\theta )=\Gamma (\theta |a;b),

allora il parametro $\theta$ è distribuito a posteriori anch'esso come una variabile casuale Gamma, ma con parametri $a+{\frac {1}{2}}$ e $b+{\frac {(\mu -x)^{2}}{2}}$ :

g(\theta |x)=\Gamma (\theta |a+1/2;b+(\mu -x)^{2}/2).

Priori coniugati normale di una normale

[modifica | modifica wikitesto]

Se $X$ è distribuita come una v.c. normale con parametri $m$ e $\sigma ^{2}$

f(x|m)=N(x|m;1/r^{2})

e il parametro $m$ è distribuito a priori come una v.c. normale con i parametri $\mu$ e $\sigma ^{2}$

g(m)=N(m|\mu ;\sigma ^{2}),

allora il parametro $m$ è distribuito a posteriori anch'esso come una v.c. Normale, ma con parametri:

(\sigma ^{2}\mu +r^{2}x)/(\sigma ^{2}+r^{2})

e

(\sigma ^{2}r^{2})/(\sigma ^{2}+r^{2})

g(m|x)=N(m|(\sigma ^{2}\mu +r^{2}x)/(\sigma ^{2}+r^{2});(\sigma ^{2}r^{2})/(\sigma ^{2}+r^{2})).

Storia

[modifica | modifica wikitesto]

Abraham de Moivre, nell'ambito dei suoi studi sulla probabilità, introdusse per la prima volta la distribuzione normale in un articolo del 1733. Gauss, che a quel tempo non era ancora nato, ne fu invece un grande utilizzatore: egli propose la "distribuzione normale" studiando il moto dei corpi celesti^[5]. Altri la usavano per descrivere fenomeni anche molto diversi come i colpi di sfortuna nel gioco d'azzardo o la distribuzione dei tiri attorno ai bersagli. Da qui i nomi "curva di Gauss" e "curva degli errori".

Nel 1809 il matematico americano Adrain pubblicò due derivazioni della legge normale di probabilità, simultaneamente e indipendentemente da Gauss^[6] I suoi lavori rimasero ampiamente ignorati dalla comunità scientifica fino al 1871, allorché furono "riscoperti" da Cleveland Abbe.^[7].

Nel 1835 Quételet pubblicò uno scritto nel quale, fra le altre cose, c'erano i dati riguardanti la misura del torace di soldati scozzesi e la statura dei militari di leva francesi. Quételet mostrò come tali dati si distribuivano come una "Gaussiana", ma non andò oltre.

Fu Galton a intuire che la curva in questione, da lui detta anche "ogiva", poteva essere applicata a fenomeni anche molto diversi, e non solo ad "errori". Questa idea di curva per descrivere i "dati" in generale portò ad usare il termine "Normale", in quanto rappresentava un substrato "normale" ovvero la "norma" per qualsiasi distribuzione presente in natura.

Nel tentativo di confrontare curve diverse, Galton - in mancanza di strumenti adeguati - si limitò ad usare due soli parametri: la media e la varianza, dando così inizio alla statistica parametrica.

Note

[modifica | modifica wikitesto]

^ curva normale in "Enciclopedia della Matematica", su treccani.it. URL consultato il 27 gennaio 2022.
^ gaussiana, distribuzione in "Dizionario di Economia e Finanza", su treccani.it. URL consultato il 27 gennaio 2022.
^ Gale Encyclopedia of Psychology — Normal Distribution
^ Ross (2003), p. 170.
^ Tony Crilly, 50 grandi idee di matematica, EDIZIONI DEDALO, 1º gennaio 2009, ISBN 9788822068095. URL consultato il 26 febbraio 2017.
^ Stigler (1978), p. 243.
^ Stigler (1978), p. 244.

Bibliografia

[modifica | modifica wikitesto]

Sheldon Ross, Probabilità e statistica per l'ingegneria e le scienze, Apogeo, 2003, ISBN 9788873038979.
Stephen M. Stigler, Mathematical Statistics in the Early States, in The Annals of Statistics, vol. 6, n. 2, 1º marzo 1978, pp. 239–265, DOI:10.1214/aos/1176344123.

Voci correlate

[modifica | modifica wikitesto]

Altri progetti

[modifica | modifica wikitesto]

Wikimedia Commons contiene immagini o altri file sulla distribuzione normale

Collegamenti esterni

[modifica | modifica wikitesto]

(EN) normal distribution, su Enciclopedia Britannica, Encyclopædia Britannica, Inc.
(EN) Eric W. Weisstein, Distribuzione normale, su MathWorld, Wolfram Research.
(EN) Thermopedia, "Gaussian Distribution"

V · D · M

Teoria della probabilità

Evento · Spazio campionario · Indipendenza stocastica · Probabilità condizionata · Teorema di Bayes · Disuguaglianza di Čebyšëv · Disuguaglianza di Markov

Variabili casuali

Misura di probabilità · Funzione di densità di probabilità · Funzione di ripartizione · Funzione caratteristica · Funzione generatrice dei momenti · Convergenza di variabili casuali

Distribuzioni di probabilità univariate

Distribuzioni discrete	Uniforme discreta · Binomiale (Bernoulliana) · Degenere · Ipergeometrica · Di Pascal · Geometrica · Poissoniana
Distribuzioni continue	Uniforme continua · Normale · Esponenziale · Beta · Gamma · t di Student · di Cauchy · Chi Quadrato

Distribuzioni di probabilità multivariate

Multinomiale · Normale multivariata · Wishart · Dirichlet

Processi stocastici

Matrice stocastica · Processo markoviano · Passeggiata aleatoria · Martingala · Moto browniano · Integrale di Itō · Equazione differenziale stocastica

Discipline connesse

Combinatoria · Statistica

Controllo di autorità	Thesaurus BNCF 57810 · LCCN (EN) sh85053556 · GND (DE) 4075494-7 · BNF (FR) cb119421818 (data) · J9U (EN, HE) 987007560462505171

Portale Matematica: accedi alle voci di Teknopedia che trattano di matematica

Estratto da "https://it.wikipedia.org/w/index.php?title=Distribuzione_normale&oldid=141425507"