Discussione:Scarto quadratico medio
Questa voce rientra tra gli argomenti trattati dal progetto tematico sottoindicato. Puoi consultare le discussioni in corso, aprirne una nuova o segnalarne una avviata qui. | |||||
|
La voce è stata monitorata per definirne lo stato e aiutarne lo sviluppo. Ha ottenuto una valutazione di livello sufficiente (giugno 2016). | ||||||||||
| ||||||||||
Monitoraggio effettuato nel giugno 2016 |
Metodo di calcolo
[modifica wikitesto]Esiste un metodo semplificato per calcolare la deviazione standard che NON prevede il calcolo preventivo della media . Man mano che arrivano i campioni si calcolano solo le seguenti grandezze:
- la sommatoria di valori (che chiamo x)
- la sommatoria dei valori al quadrato (che chiamo X)
- il numero dei campioni (che chiamo n)
La deviazione standard è SQR(X/n -(x/n)*(x/n))
- esiste un metodo ancora piuù "furbo" che non prevede il calcolo preventivo della media: calcoli la varianza e dopo ne estrai la radice :-))Tomi 08:26, ott 19, 2005 (CEST)
- scusa la battuta, ma stai semplicemente dicendo che la varianza è la media dei quadrati meno il quadrato della media, anzi (siccome non vuoi calcolare la media) è la somma dei quadrati diviso n meno il quadrato della somma diviso n quadro. perché no? basta abolire la parola "media" con le parole "somma diviso n". come vuoi tu.
- Non avete letto "preventivamente"? La tecnica che indica è un algoritmo per calcolare la deviazione standard senza dover fare due passate sui dati, cioè senza doverli memorizzare. Ovvero, se i dati vengono forniti man mano, si può calcolare la deviazione standard in spazio costante (O(1)). Blaisorblade 19:16, 3 apr 2007 (CEST)
- Ma essendo la media calcolabile "preventivamente" (o meglio, runtime) ed essendo la deviazione standard calcolata a partire dalla media di valori e valori al quadrato (ovviamente entrambe calcolabili runtime), mi pare ovvio che si possa calcolare la std runtime.
- Non avete letto "preventivamente"? La tecnica che indica è un algoritmo per calcolare la deviazione standard senza dover fare due passate sui dati, cioè senza doverli memorizzare. Ovvero, se i dati vengono forniti man mano, si può calcolare la deviazione standard in spazio costante (O(1)). Blaisorblade 19:16, 3 apr 2007 (CEST)
- scusa la battuta, ma stai semplicemente dicendo che la varianza è la media dei quadrati meno il quadrato della media, anzi (siccome non vuoi calcolare la media) è la somma dei quadrati diviso n meno il quadrato della somma diviso n quadro. perché no? basta abolire la parola "media" con le parole "somma diviso n". come vuoi tu.
La tesina citata è la fonte della spiegazione sulla differenza tra e , ma è poco accurata. La voce che ho linkato è più accurata: Stimatore_corretto#Esempio: stimatore della varianza. Blaisorblade 19:16, 3 apr 2007 (CEST)
Relazione tra le espressioni "deviazione standard" e "scarto quadratico medio"
[modifica wikitesto]Dalla lettura della voce un profano (come me) non capisce quale possa essere il rapporto tra "deviazione standard" e "scarto quadratico medio". Sono la stessa cosa? Sono cose diverse?...
- Sono la stessa cosa. E comunque entrambe le due espressioni in lingua italiana non sono riconosciute ufficialmente dalla comunità scientifica italiana; l'espressione ufficiale in lingua italiana è infatti "scarto tipo" (norma UNI ISO 3534-1:2000) a cui la voce "deviazione standard" dovrebbe essere spostata. SolePensoso (msg) 07:28, 18 lug 2009 (CEST)
- La comunità scientifica, al contrario, usa regolarmente la dizione "deviazione standard" come unica denominazione italiana. In decenni di lavoro coi numeri non avevo mai prima d'ora sentito o letto "scarto tipo". Il titolo della voce deve senz'altro essere "deviazione standard". --Pot (msg) 18:17, 9 apr 2016 (CEST)
Uso informatico
[modifica wikitesto]Ho modificato la formula in modo da rendrela coerente col testo scritto sotto. 151.96.3.242 (msg) 10:04, 13 gen 2010 (CET)
Spostamento da Deviazione standard a Standard deviation
[modifica wikitesto]Un utente anonimo aveva taglia-incollato la voce (vietato perché pialla via tutta la cronologia) da Deviazione standard a Standard deviation. Semmai si sarebbe dovuto fare uno spostamento, per questo motivo ho annullato l'operazione. Ad ogni modo aveva motivato la sua azione in questo modo e credo che la questione meriti di essere valutata.
- 87.3.151.125 (Discussione) (31 byte) (standard deviation non è esattamente traducibile con deviazione standard, indi può anche andar bene un redirect da standard deviation a deviazione standard, ma non può essere accettato il contrario, cioè dare alla voce un nome inesatto.)
Basilicofresco (msg) 08:26, 26 apr 2011 (CEST)
- In lingua italiana ho sempre sentito parlare, e tranquillamente (non capisco perché non sarebbe estattamente traducibile), di "deviazione standard". Standard deviation l'ho trovato solo in libri di statistica, e simili, in lingua inglese --Comune mortale (msg) 08:32, 26 apr 2011 (CEST)
- Esatto. Assieme all'assurdo titolo "scarto tipo", questa fantasiosa osservazione abbassa significativamente l'utilità e l'accuratezza di questa voce --Pot (msg) 18:15, 9 apr 2016 (CEST)
- In lingua italiana ho sempre sentito parlare, e tranquillamente (non capisco perché non sarebbe estattamente traducibile), di "deviazione standard". Standard deviation l'ho trovato solo in libri di statistica, e simili, in lingua inglese --Comune mortale (msg) 08:32, 26 apr 2011 (CEST)
Errore formula per applicazioni informatiche
[modifica wikitesto]se questa è la formula matematica
sqrt(1/N (Sum( x^2))-media^2),
per quale diavolo di motivo N spunta sia fuori il segno di radice, che al numeratore accanto a (Sum( x^2))?? è un errore questo.
- La formula è diversa: sqrt(1/N Sum(x-media)^2).
Nome della voce
[modifica wikitesto]Il nome della voce (scarto tipo) pur essendo, secondo quanto dice la voce, il più corretto, è di gran lunga meno usato che deviazione standard. Secondo le linee guida di Teknopedia il titolo della voce dovrebbe essere il più diffuso. Perchè in questo caso si fa un eccezione?--Malore (msg) 01:22, 31 ott 2015 (CET)
- Anche secondo me era meglio "deviazione standard".--Mat4free (msg) 13:15, 31 ott 2015 (CET)
- A me il titolo sembra palesemente assurdo. Io coi numeri ci lavoro da decenni, e "scarto tipo" non l'avevo mai sentito prima. Il fatto che esista una normativa che definisca "scarto tipo" quello che è universalmente noto come "deviazione standard" può essere una curiosità interessante, relegata ad una sezione apposita, ma certo non il titolo della voce. --Pot (msg) 18:07, 9 apr 2016 (CEST)
- Concordo, bisognerebbe reinvertire il redirect. X-Dark (msg) 14:30, 8 lug 2016 (CEST)
- Ho richiesto lo spostamento a "scarto quadratico medio", che come termine è più chiaro e preciso (anche se non si ricorda la formula, pensando che è uno scarto, che è quadratico e che è medio, ci si arriva...) e suppongo sia abbastanza comune come "deviazione standard". --Daniele Pugliesi (msg) 19:56, 8 lug 2016 (CEST)
- [@ Daniele Pugliesi, Pot, X-Dark, Mat4free, Malore] Fatto, c'è da correggere i termini in voce. [oppure, vista la discussione pregressa, richiedere un diverso titolo se lo si ritiene opportuno] --Yuma (msg) 23:25, 8 lug 2016 (CEST)
- [@ Daniele Pugliesi, Yuma, X-Dark, Mat4free, Malore] Benché scarto quadratico medio sia in certi ambiti usato come sinonimo di deviazione standard, il fatto che sia più chiaro e più preciso a me sembra discutibile. Se "scarto quadratico medio" è, letteralmente, la media degli quadrati degli scarti, allora la deviazione standard è la sua radice quadrata. In effetti, se è vero che una norma ISO introduce il termine "scarto tipo", si tratta di una buona traduzione letterale e precisa di "deviazione standard". Ma non è usata, ed è quindi inadatta come titolo. Usare scarto quadratico medio al posto di deviazione standard ripete lo stesso errore di prima: andare a cercare un termine astrattamente più "preciso" (che in questo caso preciso non è, ma è solo tradizionale) al posto di quello più diffuso. Di nuovo, il titolo dovrebbe essere "deviazione standard". --Pot (msg) 10:01, 22 ago 2016 (CEST)
- [@ Daniele Pugliesi, Pot, X-Dark, Mat4free, Malore] Fatto, c'è da correggere i termini in voce. [oppure, vista la discussione pregressa, richiedere un diverso titolo se lo si ritiene opportuno] --Yuma (msg) 23:25, 8 lug 2016 (CEST)
- Ho richiesto lo spostamento a "scarto quadratico medio", che come termine è più chiaro e preciso (anche se non si ricorda la formula, pensando che è uno scarto, che è quadratico e che è medio, ci si arriva...) e suppongo sia abbastanza comune come "deviazione standard". --Daniele Pugliesi (msg) 19:56, 8 lug 2016 (CEST)
- Concordo, bisognerebbe reinvertire il redirect. X-Dark (msg) 14:30, 8 lug 2016 (CEST)
- A me il titolo sembra palesemente assurdo. Io coi numeri ci lavoro da decenni, e "scarto tipo" non l'avevo mai sentito prima. Il fatto che esista una normativa che definisca "scarto tipo" quello che è universalmente noto come "deviazione standard" può essere una curiosità interessante, relegata ad una sezione apposita, ma certo non il titolo della voce. --Pot (msg) 18:07, 9 apr 2016 (CEST)
Collegamenti esterni modificati
[modifica wikitesto]Gentili utenti,
ho appena modificato 1 collegamento/i esterno/i sulla pagina Scarto quadratico medio. Per cortesia controllate la mia modifica. Se avete qualche domanda o se fosse necessario far sì che il bot ignori i link o l'intera pagina, date un'occhiata a queste FAQ. Ho effettuato le seguenti modifiche:
- Aggiunta del link all'archivio https://web.archive.org/web/20111231130402/http://www3.istat.it/servizi/studenti/binariodie/CorsoExcel/Glossario.htm per http://www3.istat.it/servizi/studenti/binariodie/CorsoExcel/Glossario.htm
Fate riferimento alle FAQ per informazioni su come correggere gli errori del bot
Saluti.—InternetArchiveBot (Segnala un errore) 07:19, 8 apr 2018 (CEST)
Definizione sbagliata ?
[modifica wikitesto]Lo scarto quadratico medio dovrebbe coincidere con la varianza σ², non con la deviazione standard σ come riportato nella voce. Il termine stesso indica che c'è il quadrato di una media. Ma non fa riferimento anche ad una radice quadrata, come nel termine inglese RMS (Root-Mean-Square).
Da ViaLattea.net: "Lo scarto quadratico medio -SQM- (e la sua radice quadrata) di un insieme di valori è il più usato ed importante indice di dispersione statistica. La radice quadrata dello SQM è detta deviazione standard o deviazione quadratica media. In inglese si trova la notazione ‘RMS (root mean square) deviation’."
Cosa sia poi lo scarto tipo - che nella voce viene definito come sinonimo di deviazione standard σ - andrebbe appurato leggendo la sua definizione sul manuale citato come fonte. La pagina Wiki https://it.wikipedia.org/wiki/UNI_ISO_3534-1 non risolve la questione perché, come definizione 1.23, usa invece "scarto quadratico medio" e rimanda a questa voce. --Stiglich (✉) 10:42, 24 feb 2022 (CET)
- [@ Stiglich] Concordo. Oltretutto la differenza della definizione dovrebbe essere quella rispetto alla media della distribuzione, non alla media campionaria: quello scritto ora è solo uno stimatore (peraltro deviato) dello scarto quadratico medio, ma non è lui. Correggi come ti sembra opportuno.--Equoreo (msg) 10:47, 24 feb 2022 (CET)
- Grazie per la fiducia, ma non sono un esperto di statistica. Farei pasticci. Anche perché il fraintendimento è diffuso in modo sistematico in tutta la voce. Nella Sottosezione Probabiltà sta scritto "Sia X una variabile aleatoria, lo scarto quadratico medio è definito come la radice quadrata della varianza di X." Tutto sbagliato, tutto da rifare... --Stiglich (✉) 10:56, 24 feb 2022 (CET)
- [@ Stiglich] Ok, ho trovato una fonte in italiano (io sono abituato all'inglese)... ViaLattea.net sbaglia: lo scarto quadratico medio è effettivamente la radice quadrata della varianza. Ora cerco di correggere la questione media/media campionaria.
- [@ Stiglich] Come ha già scritto Equoreo, ViaLattea.net sbaglia. Vedi anche la definizione sulla treccani (https://www.treccani.it/enciclopedia/deviazione-standard_%28Enciclopedia-della-Matematica%29/). Anche se il nome è fuorviante, si usa questo per indicare la radice della varianza.
- [@ Equoreo] Non ho capito dove dici che la definizione è sbagliata nella voce. A me sembra corretta, ma forse non ho capito cosa intendi :) --Mat4free (msg) 12:38, 24 feb 2022 (CET)
- [@ Mat4free] Sto parlando della prima riga del paragrafo "Statistica". Rileggendola non è proprio sbagliata, ma a me continua a piacere poco: il punto è che la varianza (e quindi lo SQM) si definisce sul valor medio della distribuzione, non sulla media campionaria! Infatti anche lo Sheldon a pagina 96 (citato in nota) parla di SQM campionario per quella definizione. Poi leggendo tutto capisci che quella media campionaria è veramente il valor medio poichè è l'intera popolazione N, e non un suo campione, che viene preso; quindi non è proprio sbagliato (ma già non è più applicabile alle distribuzioni continue). Però chi va a leggere il paragrafo successivo si prende un mal di testa da record dato che ora abbiamo la stessa identica definizione, con gli stessi identici simboli, ma dividiamo per N-1 invece che per N; per giunta il paragrafo lo chiamiamo "Deviazione standard corretta", come se quella prima fosse "sbagliata".
- Secondo me bisognerebbe chiarire che:
- lo SQM (vero) si calcola sul valor medio (vero), che di solito si indica , e si divide per N
- lo stimatore del SQM per un campione si fa con la media campionaria e si divide per n-1 (con n la dimensione del campione, non della popolazione).--Equoreo (msg) 14:06, 24 feb 2022 (CET)
- [@ Stiglich] Ok, ho trovato una fonte in italiano (io sono abituato all'inglese)... ViaLattea.net sbaglia: lo scarto quadratico medio è effettivamente la radice quadrata della varianza. Ora cerco di correggere la questione media/media campionaria.
- Grazie per la fiducia, ma non sono un esperto di statistica. Farei pasticci. Anche perché il fraintendimento è diffuso in modo sistematico in tutta la voce. Nella Sottosezione Probabiltà sta scritto "Sia X una variabile aleatoria, lo scarto quadratico medio è definito come la radice quadrata della varianza di X." Tutto sbagliato, tutto da rifare... --Stiglich (✉) 10:56, 24 feb 2022 (CET)
Sottoscrivo quanto detto da Equoreo --Stiglich (✉) 16:27, 24 feb 2022 (CET)
- [@ Stiglich][@ Equoreo] Non so, mi sembra che facciate un po' di confusione tra statistica descrittiva, statistica inferenziale e probabilità. Comunque se non lo trovate chiaro voi ci saranno anche altri che non lo troveranno chiaro e magari è opportuno scrivere meglio :D
- La prima definizione (quella di inizio paragrafo "Statistica") è quella usata in statistica descrittiva, in cui non c'è alcun cenno di probabilità né di campioni e si tratta con tutta la popolazione e anche la notazione della media è coerente con quella usualmente usata in quell'ambito e non ha senso parlare di "distribuzioni continue" qui.
- La seconda (quella "corretta" che forse possiamo cambiare in "non distorta" che sono sinonimi ma forse crea meno ambiguità) è quella usata in statistica inferenziale in cui quindi si parla di stimatori e di stime in effetti (e questo possiamo specificarlo).
- La terza è quella usata in probabilità, ma mi sembra che qui non ci sia confusione per voi, se ho capito bene.--Mat4free (msg) 16:45, 24 feb 2022 (CET)
- [@ Mat4free] Il motivo per cui non ho ancora toccato nulla è proprio perchè io sono consapevole che faccio confusione fra le varie statistiche. Però a maggior ragione separerei le varie cose con dei capitoli "Statistica descrittiva", "Statistica inferenziale"... La sezione di probabilità è chiara (anche se mi sfugge perchè la v.a. è X, ma la sua attesa è E[x]), e partirei da lì per la statistica inferenziale. Il paragrafo "semplificando la formula" mi sembra un modo eccellente per complicare la comprensione :-) --Equoreo (msg) 17:04, 24 feb 2022 (CET)
- Ok, magari nei prossimi giorni provo a sistemarla un po'.--Mat4free (msg) 17:14, 24 feb 2022 (CET)
- [@ Mat4free] Il motivo per cui non ho ancora toccato nulla è proprio perchè io sono consapevole che faccio confusione fra le varie statistiche. Però a maggior ragione separerei le varie cose con dei capitoli "Statistica descrittiva", "Statistica inferenziale"... La sezione di probabilità è chiara (anche se mi sfugge perchè la v.a. è X, ma la sua attesa è E[x]), e partirei da lì per la statistica inferenziale. Il paragrafo "semplificando la formula" mi sembra un modo eccellente per complicare la comprensione :-) --Equoreo (msg) 17:04, 24 feb 2022 (CET)
Organizzazione degli argomenti
[modifica wikitesto]Nella forma attuale, la voce risulta confusa perché gli argomenti sono organizzati male. Sarebbe lungo spiegare qui come e perché le varie parti del testo andrebbero organizzate in un ordine differente. Provo a ristrutturare il materiale esistente, senza modifiche testuali. --Stiglich (✉) 07:57, 25 feb 2022 (CET)
- Ho sistemato un po', Vedete se vi convince di più così. [@ Stiglich] c'era un conflitto di modifiche e forse ho cancellato epr sbaglio qualche tua modifica recente.--Mat4free (msg) 09:45, 25 feb 2022 (CET)
- Ottimo. Alcune osservazioni:
- Non avrebbe senso, come suggerito anche da altri, indicare nella Sezione "Statistica inferenziale" con la numerosità della popolazione e con quella del campione, per evidenziare la differenza tra ed ?
- Attualmente la Sezione "Statistica descrittiva" sembra composta da una sola Sottosezione (1.1 Formulazioni equivalenti). Mentre ovviamente è composta da due Sottosezioni, la prima delle quali semplicemente ora non ha un titolo. Come rimediare ?
- Nella Sezione "Statistica inferenziale" sono rimasti un po' di vecchi refusi (varianza invece di ). Sistemo...
- --Stiglich (✉) 09:53, 25 feb 2022 (CET)
- Domanda 1: Sì, lo volevo fare, ma poi vedendo che tanto la numerosità della popolazione (che potrebbe essere infinita) non era mai nominata, non l'ho fatto, ma se volete farlo, per me ok.
- Domanda 2: Non vedo il problema. La prima parte è la parte relativa alla sezione e poi c'è invece una sottosezione specifica per le altre formulazioni. Mi pare che moltissime delle voci di wikipedia (e anche in paper scientifici) utilizzino senza problemi questa formattazione editoriale (vedi ad esempio storia della matematica e numero primo, sono le prime due a caso che ho aperto, in alcune sezioni lo fanno e in altre no a seconda dei casi). In questa voce specifica, personalmente, non vedo il motivo di dare un titolo alla prima parte quando c'è già quello della sezione che è quello adatto. Mi spiego meglio: la sezione è "statistica descrittiva", poi al suo interno c'è una sottosezione che parla di "altre formulazioni" che è sostanzialmente un approfondimento.
- Domanda 3: Ok, grazie!--Mat4free (msg) 11:04, 25 feb 2022 (CET)
- OK. Capisco la posizione sul punto 2. Per il punto 1., trovo sgradevole avere due formule diverse che risultano in tutto identiche a destra dell'uguaglianza. Provvedo. --Stiglich (✉) 12:35, 25 feb 2022 (CET)
- --Stiglich (✉) 09:53, 25 feb 2022 (CET)