Indice
Distribuzione ipergeometrica
Distribuzione ipergeometrica | |
---|---|
Funzione di distribuzione discreta | |
Funzione di ripartizione | |
Parametri | |
Supporto | |
Funzione di densità | |
Valore atteso | |
Varianza | |
Indice di asimmetria | |
In teoria delle probabilità la distribuzione ipergeometrica è una distribuzione di probabilità discreta che descrive l'estrazione senza reinserimento di alcune palline, perdenti o vincenti, da un'urna.
L'estrazione con reinserimento (la pallina estratta viene rimessa nell'urna) viene invece descritta dalla distribuzione binomiale.
Ad esempio, estraendo 5 palline da un'urna che ne contiene 3 bianche e 7 nere, il numero di palline bianche estratte è descritto dalla distribuzione ipergeometrica.
Definizione
[modifica | modifica wikitesto]La distribuzione ipergeometrica descrive la variabile aleatoria che conta, per r elementi distinti estratti a caso (in modo equiprobabile) da un insieme A di cardinalità n, quanti sono nel sottoinsieme B di cardinalità h. In termini più concreti descrive, data un'urna contenente h palline bianche e n-h palline nere, il numero di palline bianche che vengono ottenute estraendo senza reinserimento r palline.
La probabilità di ottenere esattamente k elementi in B è
- .
Questa probabilità, espressa tramite i coefficienti binomiali , si può ricavare tramite il calcolo combinatorio:
- è il numero di possibili estrazioni di r elementi da A,
- è il numero di possibili estrazioni di k elementi tra gli h di B,
- è il numero di possibili estrazioni dei restanti r-k elementi tra gli n-h non in B.
Definizione alternativa
[modifica | modifica wikitesto]Una definizione equivalente considera gli elementi estratti come un sottoinsieme C di A. In questo modo la cardinalità dell'intersezione di due insiemi B e C, scelti a caso (con distribuzione uniforme) tra i sottoinsiemi di A con cardinalità fissate, è descritta dalla distribuzione ipergeometrica .
Proprietà
[modifica | modifica wikitesto]B | A-B | A | |
---|---|---|---|
C | k | r-k | r |
A-C | h-k | n-r-h+k | n-r |
A | h | n-h | n |
La formula per la probabilità presenta varie simmetrie, che si possono ricavare scambiando i ruoli che svolgono i quattro insiemi vincenti (B), non vincenti (A-B), estratti (C) e non estratti (A-C). In particolare
- scambiando vincenti con estratti
- scambiando vincenti con non vincenti
- scambiando estratti con non estratti
Caratteristiche
[modifica | modifica wikitesto]Senza bisogno di fare calcoli con i coefficienti binomiali, il valore atteso di N si può ottenere considerando per ogni elemento b di B la variabile aleatoria che vale 1 se b viene estratto e 0 altrimenti. In questo modo si ha , dove ogni segue la distribuzione di Bernoulli ; anche se, a differenza della distribuzione binomiale, le variabili non sono indipendenti tra di loro, per la linearità del valore atteso si ottiene
- .
È possibile procedere nella stessa maniera per calcolare la varianza di N tramite la varianza e la covarianza delle :
- ;
in particolare, i fattori che compaiono al numeratore sono le cardinalità dei quattro insiemi "estratti", "non estratti", "vincenti" e "non vincenti".
Altre distribuzioni
[modifica | modifica wikitesto]Per una singola estrazione la distribuzione ipergeometrica coincide con la distribuzione di Bernoulli .
A differenza della distribuzione ipergeometrica, la distribuzione binomiale corrisponde ad un processo in cui dopo ogni estrazione la pallina viene reintrodotta nell'urna, lasciando invariata la probabilità di estrarre in seguito una pallina vincente. Per valori di n e h molto grandi rispetto a r, e per h/n non vicino a 0 né a 1, ad ogni estrazione le probabilità restano quasi uguali. In statistica (ad esempio nei sondaggi) questa approssimazione viene accettata per .
La distribuzione ipergeometrica può essere generalizzata considerando differenti le probabilità di estrarre le singole palline, ovvero utilizzando una distribuzione non uniforme sull'insieme A.
Un'altra generalizzazione della distribuzione ipergeometrica è la distribuzione ipergeometrica multivariata, che prevede che nell'urna siano presenti palline di più di due colori, ovvero in cui l'insieme A non è più partizionato nei soli due insiemi B e A-B, ma in (insiemi disgiunti la cui unione è A). La distribuzione non descrive più la probabilità che k elementi siano in B e r-k in A-B, bensì la probabilità che k1 siano in B1, k2 in B2, e così via, per ogni con :
- .
Questa distribuzione di probabilità si rapporta alla distribuzione multinomiale esattamente come la distribuzione ipergeometrica si rapporta alla distribuzione binomiale.
Esempio
[modifica | modifica wikitesto]Un esempio di distribuzione ipergeometrica è dato dal gioco d'azzardo win for Life, in cui su un totale di n=20 numeri disponibili h=10 vengono scelti dal giocatore e r=10 vengono estratti. La probabilità di indovinarne k è governata dalla distribuzione ipergeometrica ,
- .
In particolare si possono calcolare facilmente le probabilità di vincita, proporzionali ai quadrati dei coefficienti binomiali ; ad esempio la probabilità che vengano estratti esattamente 6 (oppure 4) degli elementi scelti è
- .
Voci correlate
[modifica | modifica wikitesto]Altri progetti
[modifica | modifica wikitesto]- Wikimedia Commons contiene immagini o altri file su Distribuzione ipergeometrica
Collegamenti esterni
[modifica | modifica wikitesto]- (EN) William L. Hosch, hypergeometric distribution, su Enciclopedia Britannica, Encyclopædia Britannica, Inc.
- (EN) Eric W. Weisstein, Distribuzione ipergeometrica, su MathWorld, Wolfram Research.