Ordinaldaten

Es gibt verschiedene Modelle, mit denen die Struktur von Ordinaldaten beschrieben werden kann. Im Folgenden werden vier Hauptklassen von Modellen beschrieben, die jeweils für eine Zufallsvariable Y {\displaystyle Y} definiert sind}

$Y$

, mit Ebenen indiziert durch k = 1 , 2 , … , q {\displaystyle k=1,2,\dots ,q}

$k=1,2,\dots ,q$

Beachten Sie, dass in den folgenden Modelldefinitionen die Werte von μ k {\displaystyle \mu _{k}}

$\ mu _{k}$

und β {\displaystyle \mathbf {\beta } }

$\mathbf{\beta}$

werden nicht für alle Modelle für denselben Datensatz gleich sein, aber die Notation wird verwendet, um die Struktur der verschiedenen Modelle zu vergleichen.

Proportional odds modelbearbeiten
Basiskategorie logit modelEdit
Geordnetes Stereotypmodell
Benachbarte Kategorien logit modelEdit
Vergleiche zwischen den Modellen

Proportional odds modelbearbeiten

Das am häufigsten verwendete Modell für Ordinaldaten ist das proportional odds model, definiert durch log ⁡ = log ⁡ = μ k + β T x {\displaystyle \log \left=\log \left=\mu _{k}+\mathbf {\beta } ^{T}\mathbf {x} }

${\ displaystyle \log \left=\log \left=\mu _{k}+\mathbf {\beta } ^{T}\mathbf {x} }$

wobei die Parameter μ k {\displaystyle \mu _{k}}

$\mu _{k}$

die Basisverteilung der Ordinaldaten beschreiben, x {\displaystyle \mathbf {x} }

$\mathbf {x}$

sind die Kovariaten und β {\displaystyle \mathbf {\beta } }

$\mathbf{\beta}$

sind die Koeffizienten, die die Effekte der Kovariaten beschreiben.

Dieses Modell kann verallgemeinert werden, indem man das Modell definiert mit μ k + β k T x {\displaystyle \mu _{k}+\mathbf {\beta } _{k}^{T}\mathbf {x} }

${\ displaystyle \mu _{k}+\mathbf {\beta } _{k}^{T}\mathbf {x} }$

anstelle von μ k + β T x {\displaystyle \mu _{k}+\mathbf {\beta } ^{T}\mathbf {x} }

${\ displaystyle \mu _{k}+\mathbf {\beta } ^{T}\mathbf {x} }$

, und dies würde das Modell sowohl für nominale Daten (in denen die Kategorien keine natürliche Ordnung haben) als auch für ordinale Daten geeignet machen. Diese Verallgemeinerung kann es jedoch erheblich erschweren, das Modell an die Daten anzupassen.

Basiskategorie logit modelEdit

Das Basiskategorie-Modell ist definiert durch log ⁡ = μ k + β k T x {\displaystyle \log \left=\mu _{k}+\mathbf {\beta } _{k}^{T}\mathbf {x} }

${\ displaystyle \log \links=\mu _{k}+\mathbf {\beta } _{k}^{T}\mathbf {x} }$

Dieses Modell schreibt den Kategorien keine Reihenfolge vor und kann daher sowohl auf Nominaldaten als auch auf Ordinaldaten angewendet werden.

Geordnetes Stereotypmodell

Das geordnete Stereotypmodell ist definiert durch log ⁡ = μ k + ϕ k β T x {\displaystyle \log \left=\mu _{k}+\phi _{k}\mathbf {\beta } ^{T}\mathbf {x} }

${\ displaystyle \log \left=\mu _{k}+\phi _{k}\mathbf {\beta } ^{T}\mathbf {x} }$

wobei die Partiturparameter so eingeschränkt sind, dass 0 = ϕ 1 ≤ ϕ 2 ≤ ⋯ ≤ ϕ q = 1 {\displaystyle 0=\phi _{1}\leq \phi _{2}\leq \dots \leq \phi _{q}=1}

${\ displaystyle 0=\phi _{1}\leq \phi _{2}\leq \Punkte \leq \phi _{q}=1}$

Dies ist ein sparsameres und spezialisierteres Modell als das Logit-Modell der Basiskategorie: ϕ k β {\displaystyle \phi _{k}\mathbf {\beta } }

${\ displaystyle \phi _{k}\mathbf {\beta } }$

kann als ähnlich β k {\displaystyle \mathbf {\beta } _{k} angesehen werden}}

${\ displaystyle \mathbf {\beta } _{k}}$

Das nicht geordnete Stereotypmodell hat dieselbe Form wie das geordnete Stereotypmodell, jedoch ohne die Ordnung, die ϕ k {\displaystyle \phi _{k} auferlegt wird}}

$\ phi _{k}$

. Dieses Modell kann auf nominale Daten angewendet werden.

Beachten Sie, dass die angepassten Werte ϕ ^ k {\displaystyle {\hat {\phi }}_{k}}

${\ displaystyle {\hat {\phi }}_{k}}$

, geben an, wie leicht es ist, zwischen den verschiedenen Ebenen von Y {\displaystyle Y}

$Y$

zu unterscheiden. Wenn ϕ ^ k ≈ ϕ ^ k – 1 {\displaystyle {\Hut {\phi }}_{k}\ungefähr {\hut {\phi }}_{k-1}}

${\ displaystyle {\Hut {\phi }}_{k}\ungefähr {\hut {\phi }}_{k-1}}$

das bedeutet dann, dass der aktuelle Datensatz für die Kovariaten x {\displaystyle x}

$\mathbf {x}$

nicht viele Informationen liefert, um zwischen den Ebenen k {\displaystyle k} zu unterscheiden}

$k$

und k − 1 {\displaystyle k-1}

$k-1$

, aber das bedeutet nicht notwendigerweise, dass die tatsächlichen Werte k {\displaystyle k}}

$k$

und k – 1 {\displaystyle k-1}

$k-1$

sind weit voneinander entfernt. Und wenn sich die Werte der Kovariaten ändern, dann für diese neuen Daten die angepassten Werte ϕ ^ k {\displaystyle {\hat {\phi }}_{k}}

${\ displaystyle {\hat {\phi }}_{k}}$

und ϕ ^ k – 1 {\displaystyle {\hat {\phi }}_{k-1}}

${\ displaystyle {\hat {\phi }}-1}}$

könnte dann weit auseinander liegen.

Benachbarte Kategorien logit modelEdit

Das Modell benachbarter Kategorien ist definiert durch log ⁡ = μ k + β k T x {\displaystyle \log \left=\mu _{k}+\mathbf {\beta } _{k}^{T}\mathbf {x} }

${\ displaystyle \log \left=\mu _{k}+\mathbf {\beta } _{k}^{T}\mathbf {x} }$

obwohl die häufigste Form, die in Agresti (2010) als „proportionale Quotenform“ bezeichnet wird, durch log ⁡ = μ k + β T x {\displaystyle \log \left=\mu _{k}+\mathbf {\beta } ^{T}\mathbf {x} }

${\ displaystyle \log \links=\mu _{k}+\mathbf {\beta } ^{T}\mathbf {x} }$

Dieses Modell kann nur auf Ordinaldaten angewendet werden, da die Modellierung der Wahrscheinlichkeiten von Verschiebungen von einer Kategorie zur nächsten Kategorie impliziert, dass eine Reihenfolge dieser Kategorien existiert.

Das benachbarte Kategorien-Logit-Modell kann als Sonderfall des Basiskategorien-Logit-Modells betrachtet werden, wobei β k = β ( k − 1 ) {\displaystyle \mathbf {\beta } _{k}=\mathbf {\beta } (k-1)}

${\ displaystyle \mathbf {\beta }_{k}=\mathbf {\beta } (k-1)}$

. Das benachbarte Kategorien-Logit-Modell kann auch als Sonderfall des geordneten Stereotypmodells betrachtet werden, wobei ϕ k ∝ k – 1 {\displaystyle \phi _{k}\propto k-1}

${\ k {\displaystyle k}{\displaystyle k}{\displaystyle k}{\displaystyle k}{\displaystyle k}-1}$

, d.h. die Abstände zwischen den ϕ k {\displaystyle \phi _{k}}

$\phi _{k}$

werden im Voraus definiert, anstatt anhand der Daten geschätzt zu werden.

Vergleiche zwischen den Modellen

Das proportionale Quotenmodell hat eine ganz andere Struktur als die anderen drei Modelle und auch eine andere zugrunde liegende Bedeutung. Beachten Sie, dass die Größe der Referenzkategorie im proportionalen Odds-Modell mit k {\displaystyle k} variiert}

$k$

, da Y ≤ k {\displaystyle Y\leq k}

$Y\leq k$

verglichen wird mit Y > k {\displaystyle Y>k}

$Yk$