Utente:Capagira/Sandbox

Da Teknopedia, l'enciclopedia libera.
Vai alla navigazione Vai alla ricerca

Un modello statistico è un modello matematico che incorpora un insieme di assunzioni statistiche relative alla generazione di campioni di dati (o di dati in una popolazione più ampia). Un modello statistico rappresenta, spesso in forma molto astratta, il processo di generazione dei dati.

Quando ci si riferisce specificamente alle probabilità, il termine corrispondente è modello probabilistico. Un modello statistico è solitamente definito come relazione matematica tra una o più variabili casuali e altre variabili non casuali.

Tutti i test e gli stimatori statistici si basano su modelli statistici. Più in generale, i modelli statistici sono alla base dell'inferenza statistica.

Formalmente, un modello per la distribuzione di probabilità dei dati osservati è definito da una famiglia di distribuzioni , dove è indicizzata dal valore nello spazio dei parametri .

Tipologie di modelli statistici

[modifica | modifica wikitesto]

Una categorizzazione dei modelli statistici può essere basata sulle dimensioni dello spazio dei parametri :

  • Un modello parametrico prevede uno spazio dei parametri di dimensioni finite , cosicché: . Ad esempio, per dati di tipo continuo si usa spesso il modello gaussiano (univariato o multivariato) con un numero finito di parametri.
  • Un modello non parametrico ha come spazio dei parametri un sottoinsieme di uno spazio dimensioni non necessariamente finite: . Tali modelli sono utili a evitare di porre troppi vincoli sulla distribuzione dei dati, specialmente quando le informazioni a priori sono limitate. Un esempio è il modello costituito da tutte le distribuzioni di probabilità con media nulla.
  • Un modello semi-parametrico prevede uno spazio dei parametri costituito da due componenti, una di dimensioni finite e l'altra a dimensioni infinite (ad esempio una funzione ): . In tal modo si conserva parte della flessibilità dei modelli non parametrici, e la componente parametrica consente di limitare le dimensioni di .

Modelli Statistici e Apprendimento Automatico

[modifica | modifica wikitesto]

Determinare approssimazioni (in senso probabilistico) di modelli statistici che possano verosimilmente aver generato i dati osservati (valori per le variabili del modello) ossia i campioni di addestramento, rappresenta lo scopo principale degli algoritmi di apprendimento automatico (statistico). Costruito il modello, si potranno fare predizioni su valori nuovi (non osservati) attraverso metodi di inferenza. Fra i modelli statistici più utilizzati in questo campo vi sono i cosiddetti modelli grafici, per i quali le assunzioni sulle variabili del modello sono codificate da strutture a grafo.

Voci correlate

[modifica | modifica wikitesto]