Ordinale gegevens

er zijn verschillende modellen die kunnen worden gebruikt om de structuur van ordinale gegevens te beschrijven. Vier grote klassen van het model worden hieronder beschreven, elk gedefinieerd voor een willekeurige variabele Y {\displaystyle Y}

Y

, met niveaus geïndexeerd door k = 1, 2,…, q {\displaystyle k = 1,2, \ dots, q}

{\displaystyle k = 1,2, \ dots ,q}

.

merk op dat in de modeldefinities hieronder, de waarden van μ k {\displaystyle \ mu _{k}}

\mu _{k}

en β {\displaystyle \ mathbf {\beta } }

 \ mathbf {\beta}

zullen niet hetzelfde zijn voor alle modellen voor dezelfde verzameling gegevens, maar de notatie wordt gebruikt om de structuur van de verschillende modellen te vergelijken.

Proportional odds modelEdit

Het meest gebruikte model voor ordinale data is de proportionele odds model, gedefinieerd door het log ⁡ = log ⁡ = μ k + β T x {\displaystyle \log \left=\log \left=\mu _{k}+\mathbf {\beta } ^{T}\mathbf {x} }

{\displaystyle \log \left=\log \left=\mu _{k}+\mathbf {\beta } ^{T}\mathbf {x} }

waar de parameters μ k {\displaystyle \mu _{k}}

\mu _{k}

beschrijf de basis verdeling van de ordinale gegevens, x {\displaystyle \mathbf {x} }

\mathbf {x}

zijn de covariates en β {\displaystyle\mathbf {\beta } }

\mathbf {\beta}

zijn de coëfficiënten die de effecten van de covariaten beschrijven.

Dit model kan worden gegeneraliseerd door het definiëren van het model met behulp van μ k + β k T x {\displaystyle \mu _{k}+\mathbf {\beta } _{k}^{T}\mathbf {x} }

{\displaystyle \mu _{k}+\mathbf {\beta } _{k}^{T}\mathbf {x} }

in plaats van μ k + β T x {\displaystyle \mu _{k}+\mathbf {\beta } ^{T}\mathbf {x} }

{\displaystyle \mu _{k}+\mathbf {\beta } ^{T}\mathbf {x} }

, en dit maakt het model geschikt voor nominale data (waarin de categorieën hebben geen natuurlijke ordening) als ordinale gegevens. Deze generalisatie kan het echter veel moeilijker maken om het model aan de gegevens aan te passen.

Baseline category logit modelEdit

het baseline category model wordt gedefinieerd door log ⁡ = μ k + β k T x {\displaystyle \ log \ left = \mu _{k}+ \ mathbf {\beta } _{k}^{T} \ mathbf {x} }

{\displaystyle \ log \ left = \ mu _{k}+ \ mathbf {\beta } _{k}^{T} \ mathbf {x} }

dit model legt de categorieën geen volgorde op en kan dus zowel op Nominale als op ordinale gegevens worden toegepast.

Bestelde stereotype modelEdit

De bestelde stereotype model is gedefinieerd door het log ⁡ = μ k + ϕ k β T x {\displaystyle \log \left=\mu _{k}+\phi _{k}\mathbf {\beta } ^{T}\mathbf {x} }

{\displaystyle \log \left=\mu _{k}+\phi _{k}\mathbf {\beta } ^{T}\mathbf {x} }

waar de score parameters worden beperkt zodanig dat 0 = ϕ 1 ≤ ϕ 2 ≤ ⋯ ≤ ϕ q = 1 {\displaystyle 0=\phi _{1}\leq \phi _{2}\leq \punten \leq \phi _{q}=1}

{\displaystyle 0=\phi _{1}\leq \phi _{2}\leq \punten \leq \phi _{q}=1}

.

Dit is een zuiniger en specialer model dan het basislijn categorie logit model: ϕ k β {\displaystyle \ phi _{k} \ mathbf {\beta } }

{\displaystyle \phi _{k} \ mathbf {\beta } }

kan worden gezien als vergelijkbaar met β k {\displaystyle \ mathbf {\beta } _{k}}

{\displaystyle \mathbf {\beta } _{k}}

.

het niet-geordende stereotype model heeft dezelfde vorm als het geordende stereotype model, maar zonder de volgorde opgelegd aan ϕ k {\displaystyle \ phi _{k}}

\phi _{k}

. Dit model kan worden toegepast op nominale gegevens.

merk op dat de passende scores, ϕ ^ k {\displaystyle {\hat {\phi }}_{k}}

{\displaystyle {\hat {\phi }} _{k}}

, geeft aan hoe gemakkelijk het is om onderscheid te maken tussen de verschillende niveaus van Y {\displaystyle Y}

Y

. Als ϕ ^ k ≈ ϕ ^ k − 1 {\displaystyle {\hat {\phi }}_{k}\ca {\hat {\phi }}_{k-1}}

{\displaystyle {\hat {\phi }}_{k}\ca {\hat {\phi }}_{k-1}}

toen dat geeft aan dat de huidige set van gegevens voor de covariates x {\displaystyle \mathbf {x} }

\mathbf {x}

niet veel informatie om onderscheid te maken tussen de niveaus k {\displaystyle k}

k

en k − 1 {\displaystyle k-1}

k-1

, maar dat hoeft niet te betekenen dat de werkelijke waarden van k {\displaystyle k}

k

en k − 1 {\displaystyle k-1}

k-1

liggen ver uit elkaar. En als de waarden van de covariabelen veranderen, dan voor die nieuwe gegevens de passende scores ϕ ^ k {\displaystyle {\hat {\phi }}_{k}}

{\displaystyle {\hat {\phi }}_{k}}

en ϕ ^ k-1 {\displaystyle {\hat {\phi }} _{k-1}}

{\displaystyle {\hat {\phi }}_{k-1}}

kan dan ver uit elkaar liggen.

Aangrenzende categorieën logit modelEdit

De aangrenzende categorieën model is gedefinieerd door het log ⁡ = μ k + β k T x {\displaystyle \log \left=\mu _{k}+\mathbf {\beta } _{k}^{T}\mathbf {x} }

{\displaystyle \log \left=\mu _{k}+\mathbf {\beta } _{k}^{T}\mathbf {x} }

hoewel de meest voorkomende vorm, als bedoeld in Agresti (2010) als de “proportional odds vorm” is gedefinieerd door het log ⁡ = μ k + β T x {\displaystyle \log \left=\mu _{k}+\mathbf {\beta } ^{T}\mathbf {x} }

{\displaystyle \log \left=\mu _{k}+\mathbf {\beta } ^{T}\mathbf {x} }

dit model kan alleen worden toegepast op ordinale gegevens, aangezien het modelleren van de waarschijnlijkheid van verschuivingen van de ene categorie naar de volgende categorie impliceert dat een volgorde van deze categorieën bestaat.

de aangrenzende categorieën logit model kan worden gezien als een speciaal geval van de basislijn categorie logit model, waar β k = β (k − 1 ) {\displaystyle \mathbf {\beta } _{k}=\mathbf {\beta } (k)-1)}

{\ displaystyle \ mathbf {\beta } _{k}=\mathbf {\beta} (k-1)}

. De aangrenzende categorieën logit-model kan ook worden beschouwd als een speciaal geval van de bestelde stereotype model, waar ϕ k) ∝ k − 1 {\displaystyle \phi _{k}\propto k-1}

{\displaystyle \phi _{k}\propto k-1}

, d.w.z. de afstanden tussen de ϕ k {\displaystyle \phi _{k}}

\phi _{k}

vooraf gedefinieerde, in plaats van naar schatting gebaseerd op de gegevens.

vergelijkingen tussen de modeledit

het proportionele odds model heeft een heel andere structuur dan de andere drie modellen, en ook een andere onderliggende betekenis. Merk op dat de grootte van de referentiecategorie in het proportionele odds model varieert met k {\displaystyle k}

k

, aangezien Y ≤ k {\displaystyle Y\leq k}

{\displaystyle Y\leq k}

wordt vergeleken met Y > k {\displaystyle Y>k}

{\displaystyle Yk}

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.

More: