on olemassa useita eri malleja, joilla voidaan kuvata ordinaalitiedon rakennetta. Alla on kuvattu neljä malliluokkaa, joista jokainen on määritelty satunnaismuuttujalle Y {\displaystyle Y}
, jossa tasot indeksoivat K = 1 , 2,…, q {\displaystyle k=1,2,\dots ,q}
.
huomaa, että alla olevissa mallin määritelmissä μ k {\displaystyle \mu _{k}}
ja β {\displaystyle \mathbf {\beta } }
eivät ole samat kaikille saman tietojoukon malleille, mutta merkintää käytetään vertailemaan eri mallien rakennetta.
Proportional odds modelEdit
yleisimmin käytetty ordinaalidatan malli on proportional odds model, jonka määrittelee log = log = μ K + β T x {\displaystyle \log \left = \log \left=\mu _ {k}+\mathbf {\beta } ^{T}\mathbf {x} }
jossa parametrit μ K {\displaystyle \mu _{k}}
kuvaavat järjestysdatan perusjakaumaa x {\displaystyle \mathbf {x} }
ovat kovariaatit ja β {\displaystyle \mathbf {\beta } }
ovat kovariaattien vaikutuksia kuvaavat kertoimet.
tämä malli voidaan yleistää määrittelemällä malli käyttäen μ k + β K T x {\displaystyle \mu _{k} + \mathbf {\beta } _ {k}^{t}\mathbf {x} }
μ k + β T x {\displaystyle \mu _{k}+\mathbf {\beta } ^{T}\mathbf {x} }
, ja tämä tekisi mallista sopivan nimellistiedolle (jossa luokilla ei ole luonnollista järjestystä) sekä ordinaalidatalle. Tämä yleistys voi kuitenkin vaikeuttaa huomattavasti mallin sovittamista aineistoon.
perustason kategoria logit modelEdit
perustason luokkamalli on määritelty log = μ K + β K T x {\displaystyle \log \left=\mu _ {k}+\mathbf {\beta } _ {k}^{t}\mathbf {x} }
tämä malli ei aseta luokille järjestystä, joten sitä voidaan soveltaa sekä nimelliseen dataan että järjestysaineistoon.
järjestetty stereotyyppimalli
järjestetty stereotyyppimalli on määritelty log = μ K + ϕ K β T x {\displaystyle \log \left=\mu _ {k}+\phi _ {k}\mathbf {\beta } ^{T}\mathbf {x} }
jossa pisteparametreja rajoitetaan siten, että 0 = ϕ 1 ≤ ϕ 2 ≤ ⋯ ≤ ϕ q = 1 {\displaystyle 0=\phi _ {1}\leq \phi _{2}\leq \dots \leq \phi _{q}=1}
.
tämä on parsimaisempi ja erikoistuneempi malli kuin perustason logit-malli: ϕ K β {\displaystyle \phi _{k}\mathbf {\beta } }
voidaan ajatella olevan samankaltainen kuin β k {\displaystyle \mathbf {\beta } _ {k}}
.
tilaamattomalla stereotyyppimallilla on sama muoto kuin tilatulla stereotyyppimallilla, mutta ilman tilausta, joka on määrätty ϕ k {\displaystyle \phi _{k}}
. Tätä mallia voidaan soveltaa nimellisiin tietoihin.
huomaa, että sovitetut pisteet, ϕ ^ k {\displaystyle {\hat {\phi }} _ {k}}
, osoittaa, kuinka helppoa on erottaa y {\displaystyle Y}
. Jos ϕ ^ k ≈ ϕ ^ K – 1 {\displaystyle {\hat {\phi}} _ {k}\approx {\hat {\phi}} _ {k-1}}
silloin tämä osoittaa, että nykyinen tietojoukko kovariaateille x {\displaystyle \mathbf {x} }
ei tarjoa paljoakaan tietoa tasojen k {\displaystyle k erottamiseksi toisistaan}
ja k-1 {\displaystyle k-1}
, mutta se ei välttämättä tarkoita, että todelliset arvot k {\displaystyle k}
ja k − 1 {\displaystyle} k-1}
ovat kaukana toisistaan. Ja jos kovariaattien arvot muuttuvat, niin sille uudelle datalle sovitetut pisteet ϕ ^ k {\displaystyle {\hat {\phi }} _ {k}}
ja ϕ ^ K-1 {\displaystyle {\hat {\phi }} _ {k-1}}
silloin ne voivat olla kaukana toisistaan.
vierekkäiset Kategoriat logit modelEdit
viereisten luokkien malli on määritelty log = μ K + β K T x {\displaystyle \log \left=\mu _ {k}+\mathbf {\beta } _ {k}^{t}\mathbf {x} }
vaikka yleisin muoto, johon Agresti (2010) viittaa ”suhteellisena todennäköisyysmuotona”, on määritelty log = μ K + β T x {\displaystyle \log \left=\mu _{k}+\mathbf {\beta } ^{T}\mathbf {x} }
tätä mallia voidaan soveltaa vain ordinaalidataan, sillä yhdestä kategoriasta seuraavaan kategoriaan siirtyvien todennäköisyyksien mallintaminen viittaa siihen, että näiden kategorioiden järjestys on olemassa.
viereisen kategorian logit-mallia voidaan pitää perustason kategorian logit-mallin erikoistapauksena, jossa β k = β (k − 1) {\displaystyle \mathbf {\beta } _{k}=\mathbf {\beta} (k-1)}
. Viereisiä kategorioita logit-Malli voidaan ajatella myös erikoistapauksena järjestetystä stereotyyppimallista, jossa ϕ K ∝ k − 1 {\displaystyle \phi _{k}\propto k-1}
, toisin sanoen etäisyydet the k {\displaystyle \phi _{k}}
määritellään etukäteen sen sijaan, että ne estimoitaisiin aineiston perusteella.
mallien vertailut
suhteellisella kerroinmallilla on hyvin erilainen rakenne kuin kolmella muulla mallilla ja myös erilainen taustalla oleva merkitys. Huomaa, että verrannollisen kertymämallin viiteluokan koko vaihtelee k {\displaystyle k: n kanssa}
, koska Y ≤ k {\displaystyle Y\leq k}
verrataan y > k {\displaystyle Y>k}