In statistica inferenziale, in particolare nei test di verifica d'ipotesi, il valore p, o p-dei-dati[1] (dall'inglese p-value),[2] o anche livello di significatività osservato,[3] è la probabilità, per una ipotesi supposta vera (detta ipotesi nulla), di ottenere risultati ugualmente o meno compatibili di quelli osservati durante il test, con la suddetta ipotesi.[4][5] In altri termini, il valore p aiuta a capire se la differenza tra il risultato osservato e quello ipotizzato è dovuta alla casualità introdotta dal campionamento, oppure se tale differenza è statisticamente significativa, cioè difficilmente spiegabile mediante la casualità dovuta al campionamento. L'utilizzo del valore p nei test di ipotesi è comune in molti campi di ricerca[6] come fisica, economia, finanza, scienze politiche, psicologia,[7] biologia, criminologia e sociologia.[8]
Livello di significatività
[modifica | modifica wikitesto]Quando si effettua un test d'ipotesi si fissa un'ipotesi nulla e un valore soglia α (per convenzione di solito 0,05) che indica il livello di significatività del test. Calcolato il p-value relativo ai dati osservati è possibile comportarsi come segue:
- se valore p > α l'evidenza empirica non è sufficientemente contraria all'ipotesi nulla che quindi non può essere rifiutata;
- se valore p ≤ α l'evidenza empirica è fortemente contraria all'ipotesi nulla che quindi va rifiutata. In tal caso si dice che i dati osservati sono statisticamente significativi.
Tuttavia se valore p ≈ α, cioè è vicino al valore soglia, è necessaria attenzione. Il valore p viene utilizzato per fornire maggiori informazioni su un test rispetto all'accettazione o al rifiuto per un certo livello di significatività. Per questo le analisi statistiche devono sempre riportare il valore del p-value osservato permettendo ai lettori di trarre le proprie conclusioni.
Per condurre un test statistico è importante fissare il livello di significatività (indicato di solito con la lettera greca α, alfa) prima di calcolare il valore p. Se il valore p venisse calcolato per primo, lo sperimentatore saprebbe quali valori per quel livello di significatività conducono ad accettare o rigettare l'ipotesi nulla, e potrebbe scegliere il livello in funzione del risultato desiderato.
Definizione
[modifica | modifica wikitesto]Sia l'ipotesi che il valore dei dati osservati sia estratto da una certa variabile aleatoria nota. Il p-value è definito come la probabilità, supposta l'ipotesi , di ottenere un risultato (dai dati osservati) uguale o "più estremo" di quello effettivamente osservato. Cosa si intende con "più estremo" precisamente, dipende dal tipo di test che si intende effettuare. Se il test è bilaterale allora i risultati più estremi sono i valori di per cui oppure . Se il test è unilaterale destro allora i risultati più estremi sono i valori di per cui . Se il test è unilaterale sinistro allora i risultati più estremi sono i valori di per cui . Quindi il p-value è dato da:
- per test unilaterali destri;
- per test unilaterali sinistri;
- per test bilaterali.
Più il valore del p-value è piccolo, più è grande la significatività poiché il risultato ci dice che l'ipotesi considerata non spiega adeguatamente i dati osservati, cioè è poco credibile che il valore osservato sia stato effettivamente estratto dalla variabile aleatoria .
Esempio
[modifica | modifica wikitesto]Sia, ad esempio, 0,03 il valore p di un test. Il test condotto con un livello di significatività di 0,05 induce allora a rifiutare l'ipotesi nulla, mentre lo stesso test condotto con un rischio di errore di 0,02 induce a non rifiutare l'ipotesi nulla. La conclusione "il valore p è 0,03" contiene più informazioni delle sole "ipotesi rifiutata con significatività 0,05" o "non rifiutata con significatività 0,02".
Errori comuni
[modifica | modifica wikitesto]Ci sono diversi errori comuni riguardanti l'uso del p-value.
- Il p-value non è la probabilità che l'ipotesi nulla sia vera o la probabilità che l'ipotesi nulla sia falsa. Non è connesso con nessuna delle due.
- Il p-value non è la probabilità che un'osservazione sia un caso. Il calcolo del p-value è basato sull'ipotesi che ogni osservazione è un caso, un risultato aleatorio. Con la frase "il risultato è dovuto al caso" si intende di solito che l'ipotesi nulla è probabilmente corretta, ma ricordiamo che il p-value non può essere usato per rappresentare la probabilità che un'ipotesi sia vera.
- Il p-value non è la probabilità di rifiutare l'ipotesi nulla quando questa è vera.
- Il p-value non è la probabilità che replicando l'esperimento si otterrebbe la stessa conclusione. Per quantificare la replicabilità di un esperimento è stato introdotto il concetto di p-rep.
- Il livello di significatività α non è determinato dal p-value. Il livello di significatività è deciso dalla persona che conduce l'esperimento prima di vedere i dati.
Note
[modifica | modifica wikitesto]- ^ Ross (2015), pp. 310-311.
- ^ p-value in "Enciclopedia della Matematica", su treccani.it. URL consultato il 24 marzo 2022.
- ^ TEST DI SIGNIFICATIVITA', su web.archive.org, 27 luglio 2017. URL consultato il 24 marzo 2022 (archiviato dall'url originale il 27 luglio 2017).
- ^ Christie Aschwanden, Not Even Scientists Can Easily Explain P-values, su FiveThirtyEight, 24 novembre 2015. URL consultato l'11 ottobre 2019 (archiviato dall'url originale il 25 settembre 2019).
- ^ Ronald L. Wasserstein e Nicole A. Lazar, The ASA's Statement on p-Values: Context, Process, and Purpose, in The American Statistician, vol. 70, n. 2, 7 marzo 2016, pp. 129–133, DOI:10.1080/00031305.2016.1154108.
- ^ Bhaskar Bhattacharya e DeSale Habtzghi, Median of the p value under the alternative hypothesis, in The American Statistician, vol. 56, n. 3, 2002, pp. 202–6, DOI:10.1198/000313002146.
- ^ R. Wetzels, D. Matzke, M. D. Lee, J. N. Rouder, G. J. Iverson e E. -J. Wagenmakers, Statistical Evidence in Experimental Psychology: An Empirical Comparison Using 855 t Tests, in Perspectives on Psychological Science, vol. 6, n. 3, 2011, pp. 291–298, DOI:10.1177/1745691611406923, PMID 26168519.
- ^ E. Babble, The practice of social research, 11ª ed., Belmont, Thomson Wadsworth, 2007.
Bibliografia
[modifica | modifica wikitesto]- Sheldon M. Ross, Probabilità e statistica : per l'ingegneria e le scienze, a cura di Francesco Morandin, 3. ed, Maggioli, 2015, ISBN 978-88-916-0994-6, OCLC 918982377.
Voci correlate
[modifica | modifica wikitesto]Altri progetti
[modifica | modifica wikitesto]- Wikimedia Commons contiene immagini o altri file sul valore p
Collegamenti esterni
[modifica | modifica wikitesto]- (EN) p-value, su Enciclopedia Britannica, Encyclopædia Britannica, Inc.
- (EN) Eric W. Weisstein, Valore p, su MathWorld, Wolfram Research.
Controllo di autorità | GND (DE) 4605821-7 |
---|