det finnes flere forskjellige modeller som kan brukes til å beskrive strukturen til ordensdata. Fire hovedklasser av modell er beskrevet nedenfor, hver definert For en tilfeldig variabel y {\displaystyle Y}
, med nivåer indeksert av k = 1, 2,…, q {\displaystyle k = 1,2, \ prikker, q}
.
Merk at i modelldefinisjonene nedenfor er verdiene av μ k {\displaystyle \ mu _{k}}
og β {\displaystyle \mathbf {\beta } }
vil ikke være det samme for alle modellene for det samme datasettet, men notasjonen brukes til å sammenligne strukturen til de forskjellige modellene.
Proporsjonal oddsmodellrediger
den mest brukte modellen for ordenstalldata er proporsjonal oddsmodell, definert av log = log = μ k + β t x {\displaystyle \log \left=\log \left=\mu _{k}+ \ mathbf {\beta } ^{T}\mathbf {x} }
hvor parameterne μ k {\displaystyle \mu _{k}}
beskriver basefordelingen av ordenstalldataene, x {\displaystyle \mathbf {x} }
Er kovariatene og β {\displaystyle \ mathbf {\beta } }
er koeffisientene som beskriver effektene av kovariatene.
denne modellen kan generaliseres ved å definere modellen ved å bruke μ k + β k t x {\displaystyle \ mu _{k}+ \ mathbf {\beta } _{k}^{t}\mathbf {x} }
i stedet for μ k + β t x {\displaystyle \ mu _{k}+ \ mathbf {\beta } ^{T} \ mathbf {\beta} ^ {t} \ mathbf {x} }
, og dette ville gjøre modellen egnet for nominelle data (der kategoriene ikke har noen naturlig rekkefølge) så vel som ordinære data. Denne generaliseringen kan imidlertid gjøre det mye vanskeligere å tilpasse modellen til dataene.
Baseline kategorilogitmodellrediger
kategorimodellen ved baseline er definert av logg = μ k + β k t x {\displaystyle \ log \ left= \ mu _{k}+ \ mathbf {\beta } _{k}^{t}\mathbf {x} }
denne modellen pålegger ikke en bestilling på kategoriene og kan derfor brukes på nominelle data så vel som ordinære data.
Bestilt stereotypemodellrediger
den bestilte stereotypimodellen er definert av logg = μ k + ϕ k β t x {\displaystyle \log \left=\mu _{k}+\phi _{k}\mathbf {\beta } ^{T}\mathbf {x} }
der poengparametrene er begrenset slik at 0 = ϕ 1 ≤ ϕ 2 ≤ ⋯ ≤ ϕ q = 1 {\displaystyle 0 = \phi _ {1} \ leq\phi _{2} \ leq\prikker \ leq \ phi _ {q}=1}
.
dette er en mer parsimonisk og mer spesialisert modell enn baselinekategorien logit modell: ϕ k β {\displaystyle \ phi _{k} \ mathbf {\beta } }
kan betraktes som lik den β k {\displaystyle \ mathbf {\beta } _{k}}
.
den ikke-bestilte stereotypimodellen har samme form som den bestilte stereotypimodellen, men uten ordren pålagt på ϕ k {\displaystyle \ phi _{k}}
. Denne modellen kan brukes på nominelle data.
Legg merke til at de tilpassede poengene, ϕ ^ k {\displaystyle {\hat {\phi }}_{k}}
, indikerer hvor lett Det er å skille Mellom de forskjellige nivåene Av Y {\displaystyle Y}
. Hvis ϕ ^ k ≈ ϕ ^ k − 1 {\displaystyle {\hat {\phi}} _{k}\ca {\hat {\phi}} _{k-1}}
da indikerer det at dagens sett med data for kovariatene x {\displaystyle \mathbf {x} }
ikke gir mye informasjon for å skille mellom nivåene k {\displaystyle k}
og k − 1 {\displaystyle k-1}
, men det betyr ikke nødvendigvis at de faktiske verdiene k {\displaystyle k}
og k-1 {\displaystyle k-1}
er langt fra hverandre. Og hvis verdiene til kovariatene endres, så for de nye dataene er den tilpassede poengsummen ^ k {\displaystyle {\hat {\phi }}_{k}}
og ϕ ^ k − 1 {\displaystyle {\hat {\phi }} _ {k-1}}
kan da være langt fra hverandre.
tilstøtende kategorier logit modelEdit
den tilstøtende kategorimodellen er definert av logg = μ k + β k t x {\displaystyle \ log \ left= \ mu _{k}+ \ mathbf {\beta } _{k}^{T} \ mathbf {x} }
selv om den vanligste formen, referert til i Agresti (2010) som «proporsjonal oddsform», er definert av logg = μ k + β t x {\displaystyle \ log\left= \ mu _{k}+ \ mathbf {\beta } ^{T} \ mathbf {\beta} ^ {T} \ mathbf {\beta} ^ {T} \ mathbf {\beta} ^ {T} \ mathbf {x} }
denne modellen kan bare brukes på ordinære data, siden modellering av sannsynlighetene for skift fra en kategori til den neste kategorien innebærer at en bestilling av disse kategoriene eksisterer.
den tilstøtende kategoriene logit-modellen kan betraktes som et spesielt tilfelle av baseline kategori logit-modellen, der β k = β (k − 1) {\displaystyle \ mathbf {\beta } _{k}=\mathbf {\beta } (k-1)}
. Logit-modellen ved siden av kan også betraktes som et spesielt tilfelle av den bestilte stereotype modellen, der ϕ k – 1 {\displaystyle \ phi _{k} \ propto k-1}
, dvs. avstandene mellom ϕ k {\displaystyle \phi _{k}}
er definert på forhånd, i stedet for å bli estimert basert på dataene.
Sammenligninger mellom modellenerediger
den proporsjonale oddsmodellen har en helt annen struktur enn de andre tre modellene, og har også en annen underliggende betydning. Merk at størrelsen på referansekategorien i den proporsjonale oddsmodellen varierer med k {\displaystyle k}
, Siden y ≤ k {\displaystyle y\leq k}
er sammenlignet Med Y > k {\displaystyle y>k}