順序データの構造を記述するために使用できるいくつかの異なるモデルがあります。 モデルの4つの主要なクラスは以下で説明され、それぞれが確率変数Y{\displaystyle Y}に対して定義されている。}
、k=1,2,…,q{\displaystyle k=1,2,\dots,q}
で索引付けされたレベルである。
以下のモデルの定義では、μ k{\displaystyle\mu_{k}}の値は次のようになることに注意してください。}}
とβ{\displaystyle\mathbf{\beta}}
は同じデータ集合のすべてのモデルで同じではないが、異なるモデルの構造を比較するために表記法が使用される。
比例オッズモデル編集
順序データの最も一般的に使用されるモデルは、log=log=∑k+β T x{\displaystyle\log\left=\log\left=\mu_{k}+\mathbf{\beta}^{T}\mathbf{x}{\displaystyle\log\left=\log\left=\mu_{k}+\mathbf{\beta}^{T}\mathbf{x}{\displaystyle\log\left=\mu_{k}+\mathbf{\beta}^{T}\mathbf{x}}で定義される比例オッズモデルである。} }
は順序データx{\displaystyle\mathbf{x}}
は共変量であり、βは {\displaystyle\mathbf{\beta}}
は共変量の効果を記述する係数である。
このモデルは、σ k+β k T x{\displaystyle\mu_{k}+\mathbf{\beta}_{k}^{T}\mathbf{x}を使ってモデルを定義することによって一般化することができる。} }
の代わりにμ k+β T x{\displaystyle\mu_{k}+\mathbf{\beta}^{T}\mathbf{x}}
の代わりにμ k+β T x{\displaystyle\mu_{k}+\mathbf{\beta}^{T}\mathbf{x}}の代わりにμ k+β T x{\displaystyle\mu_{k} }
であり、これはモデルを序数データだけでなく(カテゴリが自然順序付けを持たない)名目データにも適している。 しかし、この一般化は、モデルをデータに適合させることをはるかに困難にする可能性があります。
ベースラインカテゴリー logit modelEdit
ベースラインカテゴリーモデルはlog λ=μ k+β k T x{\displaystyle\log\left=\mu_{k}+\mathbf{\beta}_{k}^{T}\mathbf{x}で定義される。} }
このモデルはカテゴリに順序付けを課すものではないため、ノミナルデータと順序データにも適用できます。{\Displaystyle\log\left=\mu_{k}+\phi_{k}\mathbf{\beta}^{T}\mathbf{x}{\displaystyle\log\left=\mu_{k}+\phi_{k}\mathbf{\beta}^{T}\mathbf{x}{\displaystyle\log\left=\mu_{k}+\phi_{k}\mathbf{\beta}^{T}\mathbf{x}{\displaystyle\log\left=\mu_{k}+\phi_{k}\mathbf{\beta}^{T}\mathbf{x}{{t}\mathbf{x}}で定義される。} }
.
これは、ベースラインカテゴリーロジットモデルよりも節約的で、より専門的なモデルである:ρ k β{\displaystyle\phi_{k}\mathbf{\beta}}} }
はβ k{\displaystyle\mathbf{\beta}_{k}}に似ていると考えることができる。}}
。
順序付けられていないステレオタイプモデルは順序付けられたステレオタイプモデルと同じ形をしているが、π k{\displaystyle\phi_{k}}に課された順序付けはない。}}
。 このモデルは、公称データに適用することができます。
フィットスコア、ρ^k{\displaystyle{\hat{\phi}}_{k}であることに注意してください}}
は、Y{\displaystyle Y}
の異なるレベルを区別することがいかに簡単であるかを示している。 Φ k∈^k−1{\displaystyle{\hat{\phi}}_{k}\approx{\hat{\phi}}_{k}ならば、ϕ k∈^k∈^k−1{\displaystyle{\hat{\phi}}_{k}\approx{\hat{\phi-1}}
これは、共変量x{\displaystyle\mathbf{x}}
の現在のデータ集合が、レベルk{\displaystyle k}を区別するための多くの情報を提供していないことを示しています}
そしてk−1{\displaystyle k−1}
であるが、それは必ずしも実際の値k{\displaystyle k}であることを意味するものではない。}
とk−1{\displaystyle k-1}
は遠く離れています。 共変量の値が変化すると、その新しいデータに対して適合スコアρ^k{\displaystyle{\hat{\phi}}_{k}}が得られる。}}
とπ^k−1{\displaystyle{\hat{\phi}}_{k}}とπ^k-1{\displaystyle{\hat{\phi}}_{k}}とπ^k-1{\displaystyle-1}}
その後、遠く離れている可能性があります。
隣接圏logit modelEdit
隣接圏モデルはlog λ=μ k+β k T x{\displaystyle\log\left=\mu_{k}+\mathbf{\beta}_{k}^{T}\mathbf{x}で定義される。} }
最も一般的な形式であるが、Agresti(2010)では「比例オッズ形式」と呼ばれているが、log=∑k+β T x{\displaystyle\log\left=\mu_{k}+\mathbf{\beta}^{T}\mathbf{x}}で定義される。} }
\mu_{k}+\mathbf{\beta}^{T}\mathbf{x}
\mu_{k}+\mathbf
あるカテゴリから次のカテゴリへのシフトの確率をモデル化することは、それらのカテゴリの順序付けが存在することを意味するため、このモデ
隣接圏ロジットモデルは、β k=β(k−1){\displaystyle\mathbf{\beta}_{k}=\mathbf{\beta}(k)}であるベースラインカテゴリーロジットモデルの特別な場合と考えることができる。-1)}
. 隣接圏ロジット模型は順序ステレオタイプ模型の特別な場合と考えることもでき、ここで∂k∈k−1{\displaystyle\phi_{k}\propto k-1}
, すなわち、π k{\displaystyle\phi_{k}}
間の距離は、データに基づいて推定されるのではなく、事前に定義されている。
モデル間の比較編集
比例オッズモデルは、他の3つのモデルとは構造が非常に異なり、基本的な意味も異なります。 比例オッズモデルにおける基準圏の大きさはk{\displaystyle k}によって変化することに注意してください}
, Y≤k{\displaystyle Y\leq k}
はY>k{\displaystyle Y>k}
と比較されるからである。