Esistono diversi modelli che possono essere utilizzati per descrivere la struttura dei dati ordinali. Di seguito sono descritte quattro classi principali di modello, ciascuna definita per una variabile casuale Y {\displaystyle Y}
, con livelli indicizzati da k = 1 , 2 , … , q {\displaystyle k=1,2,\dots ,q}
.
si noti che nel modello definizioni di seguito, i valori di µ k {\displaystyle \mu _{k}}
e β {\displaystyle \mathbf {\beta } }
non sarà lo stesso per tutti i modelli per lo stesso set di dati, ma la notazione utilizzata per confrontare la struttura dei diversi modelli.
quote Proporzionali modelEdit
più comunemente usati, modello per i dati ordinali è la probabilità proporzionale modello, definito dal registro = log = µ k + β T x {\displaystyle \log \left=\log \left=\mu _{k}+\mathbf {\beta } ^{T}\mathbf {x} }
dove i parametri µ k {\displaystyle \mu _{k}}
descrivere la distribuzione di base del numero ordinale di dati, x {\displaystyle \mathbf {x} }
sono le covariate e β {\displaystyle \ mathbf {\beta}}
sono i coefficienti che descrivono gli effetti delle covariate.
Questo modello può essere generalizzata, definendo il modello utilizzando µ k + β k T x {\displaystyle \mu _{k}+\mathbf {\beta } _{k}^{T}\mathbf {x} }
invece di µ k + β T x {\displaystyle \mu _{k}+\mathbf {\beta } ^{T}\mathbf {x} }
e questo sarebbe il modello adatto per i dati nominali (in cui le categorie non hanno alcun ordinamento naturale) così come i dati ordinali. Tuttavia, questa generalizzazione può rendere molto più difficile adattare il modello ai dati.
linea di base categoria logit modelEdit
La linea di base categoria modello è definito dal registro = µ k + β k T x {\displaystyle \log \left=\mu _{k}+\mathbf {\beta } _{k}^{T}\mathbf {x} }
Questo modello non imporre un ordinamento in categorie e possono essere applicati ai dati nominali nonché i dati ordinali.
Ordinato stereotipo modelEdit
ordinato stereotipo modello è definito dal registro = µ k + ϕ k β T x {\displaystyle \log \left=\mu _{k}+\phi _{k}\mathbf {\beta } ^{T}\mathbf {x} }
dove il punteggio parametri sono vincolati tale che 0 = ϕ 1 ≤ ϕ 2 ≤ ⋯ ≤ ϕ q = 1 {\displaystyle 0=\phi _{1}\leq \phi _{2}\leq \dots \leq \phi _{q}=1}
.
Questo è il più parsimonioso, più specializzati, modello rispetto alla linea di base categoria del modello logit: ϕ k β {\displaystyle \phi _{k}\mathbf {\beta } }
può essere pensato come simile a β k {\displaystyle \mathbf {\beta } _{k}}
.
Il modello di stereotipo non ordinato ha la stessa forma del modello di stereotipo ordinato, ma senza l’ordine imposto su k k {\displaystyle \ phi _ {k}}
. Questo modello può essere applicato ai dati nominali.
Si noti che i punteggi montati, ^ ^ k {\displaystyle {\hat {\phi }} _{k}}
, indica quanto sia facile distinguere tra i diversi livelli di Y {\displaystyle Y}
. Se ϕ ^ k ≈ ϕ ^ k − 1 {\displaystyle {\hat {\phi }}_{k}\approx {\hat {\phi }}_{k-1}}
poi che indica che l’attuale set di dati per le covariate x {\displaystyle \mathbf {x} }
non fornisce molte informazioni, per distinguere tra i livelli k {\displaystyle k}
e k − 1 {\displaystyle k-1}
, ma questo non implica necessariamente che i valori reali di k {\displaystyle k}
e k − 1 {\displaystyle k-1}
sono distanti tra loro. E se i valori delle covariate cambiare, quindi per che nuovi dati montato punteggi ϕ ^ k {\displaystyle {\hat {\phi }}_{k}}
e ϕ ^ k − 1 {\displaystyle {\hat {\phi }}_{k-1}}
potrebbe quindi essere distanti.
categorie vicine logit modelEdit
adiacente categorie modello è definito dal registro = µ k + β k T x {\displaystyle \log \left=\mu _{k}+\mathbf {\beta } _{k}^{T}\mathbf {x} }
anche se la forma più comune, di cui all’Agresti (2010) come la “probabilità proporzionale forma” è definita dal registro = µ k + β T x {\displaystyle \log \left=\mu _{k}+\mathbf {\beta } ^{T}\mathbf {x} }
Questo modello può essere applicato solo ai dati ordinali, poiché la modellazione delle probabilità di spostamenti da una categoria alla categoria successiva implica che esiste un ordine di tali categorie.
adiacente categorie modello logit può essere considerato come un caso particolare della linea di base categoria del modello logit, dove β k = β ( k − 1 ) {\displaystyle \mathbf {\beta } _{k}=\mathbf {\beta } (k-1)}
. Adiacente categorie modello logit può anche essere considerato come un caso particolare di quanto ordinato stereotipo modello, dove ϕ k ∝ k − 1 {\displaystyle \phi _{k}\propto k-1}
, cioè la distanza tra il ϕ k {\displaystyle \phi _{k}}
sono definite in anticipo, piuttosto che essere stimata in base ai dati.
Confronti tra i modellimodifica
Il modello di probabilità proporzionale ha una struttura molto diversa dagli altri tre modelli e anche un significato sottostante diverso. Si noti che la dimensione della categoria di riferimento in quote proporzionali modello varia con il variare di k {\displaystyle k}
, dal momento che Y ≤ k {\displaystyle Y\leq k}
è rispetto ad Y > k {\displaystyle Y>k}