Technopedia Center
PMB University Brochure
Faculty of Engineering and Computer Science
S1 Informatics S1 Information Systems S1 Information Technology S1 Computer Engineering S1 Electrical Engineering S1 Civil Engineering

faculty of Economics and Business
S1 Management S1 Accountancy

Faculty of Letters and Educational Sciences
S1 English literature S1 English language education S1 Mathematics education S1 Sports Education
teknopedia

teknopedia

teknopedia

teknopedia

teknopedia

teknopedia
teknopedia
teknopedia
teknopedia
teknopedia
teknopedia
  • Registerasi
  • Brosur UTI
  • Kip Scholarship Information
  • Performance
  1. Weltenzyklopädie
  2. Outlier - Teknopedia
Outlier - Teknopedia

Outlier è un termine utilizzato in statistica per definire, in un insieme di osservazioni, un valore anomalo e aberrante, ossia un valore chiaramente distante dalle altre osservazioni disponibili.[1]

Non esiste una definizione matematica di outlier.[2]

Uno dei possibili modi di valutare se un dato sia un outlier è di confrontarlo con l'intervallo interquartile [ Q 1 , Q 3 ] {\displaystyle [Q_{1},Q_{3}]} {\displaystyle [Q_{1},Q_{3}]} di tutti i dati osservati, calcolando la sua distanza dall'intervallo e rapportandola alla misura dell'intervallo stesso, con un parametro k {\displaystyle k} {\displaystyle k}

[ Q 1 − k I , Q 3 + k I ] . {\displaystyle {\big [}Q_{1}-kI,Q_{3}+kI{\big ]}.} {\displaystyle {\big [}Q_{1}-kI,Q_{3}+kI{\big ]}.}

Dove Q 1 {\displaystyle Q_{1}} {\displaystyle Q_{1}} e Q 3 {\displaystyle Q_{3}} {\displaystyle Q_{3}} sono rispettivamente il primo e il terzo quartile, I = Q 3 − Q 1 {\displaystyle I=Q_{3}-Q_{1}} {\displaystyle I=Q_{3}-Q_{1}} è lo scarto interquartile e k {\displaystyle k} {\displaystyle k} è un parametro fissato.

L'intervallo per k=1 in una gaussiana, rispetto alla deviazione standard

Normalmente si pone k = 1. {\displaystyle k=1.} {\displaystyle k=1.}[3]

John Tukey propone di considerare k = 1 , 5 {\displaystyle k=1,5} {\displaystyle k=1,5}[4], ovvero un outlier disterebbe dalla media di Q 1 {\displaystyle Q_{1}} {\displaystyle Q_{1}} e Q 3 {\displaystyle Q_{3}} {\displaystyle Q_{3}} più di due volte la distanza tra Q 1 {\displaystyle Q_{1}} {\displaystyle Q_{1}} e Q 3 {\displaystyle Q_{3}} {\displaystyle Q_{3}}.

Gli outlier sono valori numericamente distanti dal resto dei dati raccolti (ad esempio, in un campionamento). Le statistiche che derivano da campioni contenenti outlier possono essere fuorvianti. Per esempio, se misurassimo la temperatura di dieci oggetti presenti in una stanza, la maggior parte dei quali risultasse avere una temperatura compresa fra 20 e 25 gradi Celsius, allora il forno acceso, avente una temperatura di 250 gradi, sarebbe un dato aberrante. La mediana dei valori sarebbe circa 23, mentre la temperatura media salirebbe a circa 45 gradi: un indice chiaramente non rappresentativo della maggioranza dei valori di temperatura riscontrati nella stanza. In questo caso, la mediana rifletterebbe meglio della media aritmetica le misure della temperatura degli oggetti. Gli outlier possono essere indicativi del fatto che, in un dato campione, alcuni dati appartengono a una popolazione differente rispetto a quella del resto del campione.

Nella maggioranza dei grandi campioni, alcuni dati saranno più lontani dalla media del campione di quanto sarebbe probabile aspettarsi. Ciò può essere dovuto a un errore sistematico che si è verificato nella raccolta dei dati, oppure a una fallacia nella teoria che ha orientato l'assunzione di una data distribuzione campionaria di probabilità, ma potrebbe anche essere semplicemente dovuto al caso, che ha fatto sì che nella raccolta dei dati alcune osservazioni abbiano prodotto dati molto lontani dai valori medi del campione. Inoltre, gli outlier potrebbero essere indicativi di dati errati, procedure erronee o aree sperimentali in cui alcune teorie potrebbero non essere valide. Tuttavia, un piccolo numero di dati aberranti non dovuti a condizioni anomale è dato per scontato nei grandi campioni.

Stimatori poco influenzati dagli outlier sono detti robusti.

Note

[modifica | modifica wikitesto]
  1. ↑ Gli statistici italiani preferiscono tradizionalmente parlare di dati anomali o aberranti. Il significato è il medesimo.
  2. ↑ Arthur Zimek e Peter Filzmoser, There and back again: Outlier detection between statistical reasoning and data mining algorithms (PDF), in Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, vol. 8, n. 6, 2018, pp. e1280, DOI:10.1002/widm.1280, ISSN 1942-4787 (WC · ACNP). URL consultato il 14 novembre 2021 (archiviato dall'url originale il 14 novembre 2021).
  3. ↑ Libro statistica - Paul Newbold
  4. ↑ John W Tukey, Exploratory Data Analysis, Addison-Wesley, 1977, ISBN 978-0-201-07616-5, OCLC 3058187.

Voci correlate

[modifica | modifica wikitesto]
  • Campionamento statistico
  • Criterio di Chauvenet

Altri progetti

[modifica | modifica wikitesto]

Altri progetti

  • Wikimedia Commons
  • Collabora a Wikimedia Commons Wikimedia Commons contiene immagini o altri file su Outlier

Collegamenti esterni

[modifica | modifica wikitesto]
  • (EN) Eric W. Weisstein, Outlier, su MathWorld, Wolfram Research. Modifica su Wikidata
V · D · M
Concetti fondamentali di metrologia, statistica e metodologia della ricerca
Definizioni di baseMisurazione · Misura di probabilità · Proprietà fisica · Grandezza fisica · Parametro · Popolazione statistica · Valore vero · Campione · Misurando · Precisione · Accuratezza · Ripetibilità · Riproducibilità · Significatività · Tolleranza · Sensibilità · Risoluzione (Risoluzione laterale) · Omoschedasticità · Eteroschedasticità · Ipotesi statistica · Ipotesi nulla · Approssimazione · Cifra significativa · Variabile casuale · Normalizzazione · Standardizzazione
Trattamento degli erroriIncertezza di misura · Errore di misurazione · Errore sistematico · Errore statistico · Errore di sensibilità · Falso positivo e falso negativo · Errore assoluto · Errore relativo · Propagazione degli errori · Bias
Minimizzazione dell'erroreBianco analitico · Taratura · Calibrazione · Rapporto segnale/rumore · Confronto interlaboratorio · Qualità dei dati · Outlier
CampionamentoSpazio campionario · Campionamento statistico · Piano di campionamento · Campionamento ragionato · Campionamento per quote · Campionamento casuale (Campionamento sistematico · Campionamento stratificato · Campionamento a grappoli · Campionamento multistadio) · Campionamento probabilistico
Parametri di varianzaVarianza · Covarianza · Scarto quadratico medio · Devianza · Intervallo dinamico · Coefficiente di variazione
TestTest di verifica d'ipotesi (Test parametrico· Test non parametrico) · Intervallo di confidenza · Valore p
Controllo di autoritàThesaurus BNCF 57147 · LCCN (EN) sh85096171 · GND (DE) 4510494-3 · BNF (FR) cb12127529t (data) · J9U (EN, HE) 987007553465305171
  Portale Matematica
  Portale Scienza e tecnica
  Portale Statistica
Estratto da "https://it.wikipedia.org/w/index.php?title=Outlier&oldid=145457449"

  • Indonesia
  • English
  • Français
  • 日本語
  • Deutsch
  • Italiano
  • Español
  • Русский
  • فارسی
  • Polski
  • 中文
  • Nederlands
  • Português
  • العربية
Pusat Layanan

UNIVERSITAS TEKNOKRAT INDONESIA | ASEAN's Best Private University
Jl. ZA. Pagar Alam No.9 -11, Labuhan Ratu, Kec. Kedaton, Kota Bandar Lampung, Lampung 35132
Phone: (0721) 702022