Technopedia Center
PMB University Brochure
Faculty of Engineering and Computer Science
S1 Informatics S1 Information Systems S1 Information Technology S1 Computer Engineering S1 Electrical Engineering S1 Civil Engineering

faculty of Economics and Business
S1 Management S1 Accountancy

Faculty of Letters and Educational Sciences
S1 English literature S1 English language education S1 Mathematics education S1 Sports Education
teknopedia

teknopedia

teknopedia

teknopedia

teknopedia

teknopedia
teknopedia
teknopedia
teknopedia
teknopedia
teknopedia
  • Registerasi
  • Brosur UTI
  • Kip Scholarship Information
  • Performance
  1. Weltenzyklopädie
  2. Probit multinomiale - Teknopedia
Probit multinomiale - Teknopedia

In statistica e apprendimento automatico, il modello probit multinomiale è una generalizzazione del modello probit per problemi con più di due categorie possibili per la variabile dipendente [1]. Quindi esso rappresenta un'alternativa al modello logit multinomiale da utilizzare per problemi di apprendimento supervisionato multi-classe. Non va però confuso con il modello probit multivariato, utilizzato per modellare casi con risultati binari correlati per più variabili indipendenti.

Specifica generale

[modifica | modifica wikitesto]

Si suppone di avere una serie di osservazioni Yi, per i = 1... n, dei risultati di scelte fra K valori tratte da una distribuzione categorica di dimensione K (ci sono K > 2 scelte possibili). A ciascuna osservazione Yi è associato un vettore di m valori osservati x1,i, ..., xm,i di variabili esplicative (note anche come variabili indipendenti, variabili predittive, caratteristiche, ecc.). Alcuni esempi:

  • I risultati osservati potrebbero essere "ha la malattia A, ha la malattia B, ha la malattia C, non ha nessuna delle malattie" per un insieme di malattie rare con sintomi simili, e le variabili esplicative potrebbero essere caratteristiche dei pazienti ritenute pertinenti (sesso, razza, età, pressione sanguigna, indice di massa corporea, presenza o assenza di vari sintomi, ecc.).
  • I risultati osservati sono i voti delle persone per un dato partito o candidato in un'elezione con più di 2 opzioni e le variabili esplicative sono le caratteristiche demografiche di ciascuna persona (ad esempio sesso, razza, età, reddito, ecc.).

Il modello probit multinomiale è un modello statistico utilizzabile per predire il probabile esito non osservato di un esperimento multifattoriale, date le variabili esplicative associate. Nel processo, il modello cerca di spiegare l'effetto relativo di diverse variabili esplicative sui diversi esiti.

Formalmente, i risultati Yi possono essere descritti come dati distribuiti categoricamente, in cui ogni valore di risultato h per l'osservazione i si verifica con una probabilità non osservata pi,h specifica per l'osservazione i in questione perché determinata dai valori delle variabili esplicative associate a tale osservazione. Vale a dire:

Y i | x 1 , i , … , x m , i   ∼ Cat ⁡ ( p i , 1 , … , p i , K ) ,  per  i = 1 , … , n {\displaystyle Y_{i}|x_{1,i},\ldots ,x_{m,i}\ \sim \operatorname {Cat} (p_{i,1},\ldots ,p_{i,K}),{\text{ per }}i=1,\dots ,n} {\displaystyle Y_{i}|x_{1,i},\ldots ,x_{m,i}\ \sim \operatorname {Cat} (p_{i,1},\ldots ,p_{i,K}),{\text{ per }}i=1,\dots ,n}

o equivalentemente

Pr [ Y i = h | x 1 , i , … , x m , i ] = p i , h ,  per  i = 1 , … , n , {\displaystyle \Pr[Y_{i}=h|x_{1,i},\ldots ,x_{m,i}]=p_{i,h},{\text{ per }}i=1,\dots ,n,} {\displaystyle \Pr[Y_{i}=h|x_{1,i},\ldots ,x_{m,i}]=p_{i,h},{\text{ per }}i=1,\dots ,n,}

per ciascuno dei K possibili valori di h.

Modello con variabili latenti

[modifica | modifica wikitesto]

Il probit multinomiale è spesso scritto in termini di modello con variabili latenti:

Y i 1 ∗ = β 1 ⋅ X i + ε 1 Y i 2 ∗ = β 2 ⋅ X i + ε 2 … … Y i K ∗ = β K ⋅ X i + ε K {\displaystyle {\begin{aligned}Y_{i}^{1\ast }&={\boldsymbol {\beta }}_{1}\cdot \mathbf {X} _{i}+\varepsilon _{1}\,\\Y_{i}^{2\ast }&={\boldsymbol {\beta }}_{2}\cdot \mathbf {X} _{i}+\varepsilon _{2}\,\\\ldots &\ldots \\Y_{i}^{K\ast }&={\boldsymbol {\beta }}_{K}\cdot \mathbf {X} _{i}+\varepsilon _{K}\,\\\end{aligned}}} {\displaystyle {\begin{aligned}Y_{i}^{1\ast }&={\boldsymbol {\beta }}_{1}\cdot \mathbf {X} _{i}+\varepsilon _{1}\,\\Y_{i}^{2\ast }&={\boldsymbol {\beta }}_{2}\cdot \mathbf {X} _{i}+\varepsilon _{2}\,\\\ldots &\ldots \\Y_{i}^{K\ast }&={\boldsymbol {\beta }}_{K}\cdot \mathbf {X} _{i}+\varepsilon _{K}\,\\\end{aligned}}}

dove

ε ∼ N ( 0 , Σ ) {\displaystyle {\boldsymbol {\varepsilon }}\sim {\mathcal {N}}(0,{\boldsymbol {\Sigma }})} {\displaystyle {\boldsymbol {\varepsilon }}\sim {\mathcal {N}}(0,{\boldsymbol {\Sigma }})}

allora

Y i = { 1 se  Y i 1 ∗ > Y i 2 ∗ , … , Y i K ∗ 2 se  Y i 2 ∗ > Y i 1 ∗ , Y i 3 ∗ , … , Y i K ∗ … … K altrimenti {\displaystyle Y_{i}={\begin{cases}1&{\text{se }}Y_{i}^{1\ast }>Y_{i}^{2\ast },\ldots ,Y_{i}^{K\ast }\\2&{\text{se }}Y_{i}^{2\ast }>Y_{i}^{1\ast },Y_{i}^{3\ast },\ldots ,Y_{i}^{K\ast }\\\ldots &\ldots \\K&{\text{altrimenti}}\end{cases}}} {\displaystyle Y_{i}={\begin{cases}1&{\text{se }}Y_{i}^{1\ast }>Y_{i}^{2\ast },\ldots ,Y_{i}^{K\ast }\\2&{\text{se }}Y_{i}^{2\ast }>Y_{i}^{1\ast },Y_{i}^{3\ast },\ldots ,Y_{i}^{K\ast }\\\ldots &\ldots \\K&{\text{altrimenti}}\end{cases}}}

ossia,

Y i = a r g m a x h = 1 , … , K Y i h ∗ {\displaystyle Y_{i}=\mathrm {argmax} _{h=1,\ldots ,K}Y_{i}^{h\ast }} {\displaystyle Y_{i}=\mathrm {argmax} _{h=1,\ldots ,K}Y_{i}^{h\ast }}

Si noti che questo modello consente una correlazione arbitraria tra le variabili di errore, quindi non rispetta necessariamente la proprietà di indipendenza delle alternative irrilevanti.

Quando Σ {\displaystyle {\boldsymbol {\Sigma }}} {\displaystyle {\boldsymbol {\Sigma }}} è la matrice identità (tale che non vi sia correlazione o eteroschedasticità), il modello viene detto probit indipendente.

Stima

[modifica | modifica wikitesto]

Per i dettagli su come vengono stimate le equazioni[2], si veda la voce Modello Probit.

Note

[modifica | modifica wikitesto]
  1. ^ Luiz Paulo Fávero e Patrícia Belfiore, Chapter 14 - Binary and Multinomial Logistic Regression Models, Academic Press, 2019, pp. 539–615, DOI:10.1016/b978-0-12-811216-8.00014-8, ISBN 978-0-12-811216-8.
  2. ^ (EN) Yosef Sheffi, Randy Hall e Carlos Daganzo, On the estimation of the multinomial probit model, in Transportation Research Part A: General, vol. 16, n. 5-6, 1982-09, pp. 447–456, DOI:10.1016/0191-2607(82)90071-1.

Bibliografia

[modifica | modifica wikitesto]
  • William H. Greene, Econometric Analysis, Seventh, Pearson Education, 2012, pp. 810–811, ISBN 978-0-273-75356-8.


V · D · M
Apprendimento automatico
ProblemiTeoria dell'apprendimento statistico · Classificazione · Regressione · Classificazione a singola classe · Ranking · Regole di associazione · Apprendimento non supervisionato · Apprendimento semi-supervisionato · Apprendimento supervisionato · Apprendimento auto-supervisionato · Apprendimento per rinforzo · Apprendimento profondo · Apprendimento online · Apprendimento incrementale · Apprendimento trasduttivo

Apprendimento non supervisionatoClustering · Clustering gerarchico · K-means · Algoritmo EM · DBSCAN · Mean shift · Rete generativa avversaria (cGAN · VAE-GAN · cycleGAN)
Apprendimento supervisionatoAlbero di decisione · Foresta casuale · Conditional random field CRF · Modello di Markov nascosto · Algoritmo k-nearest neighbors (k-NN) · Ragionamento basato su casi (CBR) · Classificatore bayesiano · Rete neurale artificiale · Regressione lineare · Regressione logistica · Modello grafico · Rete bayesiana · Macchine a vettori di supporto (SVM) · Processo gaussiano · Modello ensemble · Boosting · Bagging · Stacking · Voting · Cascading · Error correcting output code (ECOC)
Apprendimento per rinforzoQ-learning · SARSA · TD
Riduzione della dimensionalitàAnalisi fattoriale · Analisi della correlazione canonica (CCA) · Analisi delle componenti indipendenti (ICA) · Analisi discriminante lineare (LDA) · Analisi delle componenti principali (PCA) · Selezione delle caratteristiche · Estrazione di caratteristiche · t-distributed stochastic neighbor embedding (t-SNE)
Reti neurali artificialiPercettrone · Percettrone basato su kernel · Rete neurale a funzioni base radiali (RBF net) · Rete neurale feed-forward · Rete di Hopfield · Percettrone multistrato · Rete neurale ricorrente (LSTM) · Macchina di Boltzmann ristretta · Mappa auto-organizzata · Rete neurale convoluzionale · Rete neurale a ritardo · Rete neurale spiking · Rete neurale grafica · Trasformatore
SoftwareKeras · Microsoft Cognitive Toolkit · Scikit-learn · TensorFlow · Theano · PyTorch · Weka
AltroAlgoritmo genetico · Particle Swarm Optimization · Caratteristica · Compromesso bias-varianza · Minimizzazione del rischio empirico
V · D · M
Statistica
Teoria statistica
Statistica descrittivaMedia (aritmetica · geometrica · armonica · di potenza · aritmetico-geometrica · integrale) · Mediana · Moda · Intervallo di variazione · Varianza · Deviazione standard · Scarto medio assoluto · Simmetria · Differenza media (assoluta · logaritmica) · Curtosi
Inferenza statisticaTest di verifica d'ipotesi · Significatività · Ipotesi nulla/alternativa · Errore del I e del II tipo · Test Q · Test U · Test t · Test Z · Massima verosimiglianza · Standardizzazione · Valore p · Analisi della varianza
Analisi di sopravvivenzaTasso di guasto · Stimatore di Kaplan-Meier · Test dei ranghi logaritmici
Analisi della regressioneRegressione lineare · Regressione nonlineare · Variabili strumentali · Metodo generalizzato dei momenti · Regressione logistica · Modello probit · Modello logit
Statistica economica
Istituti statisticiISTAT · EuroSTAT · Royal Statistical Society · U.S. Census Bureau · ISI · INSEE
Siti web statisticiOur World in Data · Statista · Bloomberg Terminal · Google Public Data Explorer · World Inequality Database · TradingEconomics · ACLED
Software econometricigretl · EViews
Estratto da "https://it.wikipedia.org/w/index.php?title=Probit_multinomiale&oldid=148223577"

  • Indonesia
  • English
  • Français
  • 日本語
  • Deutsch
  • Italiano
  • Español
  • Русский
  • فارسی
  • Polski
  • 中文
  • Nederlands
  • Português
  • العربية
Pusat Layanan

UNIVERSITAS TEKNOKRAT INDONESIA | ASEAN's Best Private University
Jl. ZA. Pagar Alam No.9 -11, Labuhan Ratu, Kec. Kedaton, Kota Bandar Lampung, Lampung 35132
Phone: (0721) 702022