順序データ

順序データの構造を記述するために使用できるいくつかの異なるモデルがあります。 モデルの4つの主要なクラスは以下で説明され、それぞれが確率変数Y{\displaystyle Y}に対して定義されている。}

Y

、k=1,2,…,q{\displaystyle k=1,2,\dots,q}

{\displaystyle k=1,2,\dots,q}

で索引付けされたレベルである。

以下のモデルの定義では、μ k{\displaystyle\mu_{k}}の値は次のようになることに注意してください。}}

\mu_{k}

とβ{\displaystyle\mathbf{\beta}}

\mathbf{\beta}

は同じデータ集合のすべてのモデルで同じではないが、異なるモデルの構造を比較するために表記法が使用される。

比例オッズモデル編集

順序データの最も一般的に使用されるモデルは、log⁡=log⁡=∑k+β T x{\displaystyle\log\left=\log\left=\mu_{k}+\mathbf{\beta}^{T}\mathbf{x}{\displaystyle\log\left=\log\left=\mu_{k}+\mathbf{\beta}^{T}\mathbf{x}{\displaystyle\log\left=\mu_{k}+\mathbf{\beta}^{T}\mathbf{x}}で定義される比例オッズモデルである。} }

{\ここで、パラメータμ k{\displaystyle\mu_{k}}

\mu_{k}

は順序データx{\displaystyle\mathbf{x}}

\mathbf{x}の基底分布を記述する。x}

は共変量であり、βは {\displaystyle\mathbf{\beta}}

\mathbf{\beta}

は共変量の効果を記述する係数である。

このモデルは、σ k+β k T x{\displaystyle\mu_{k}+\mathbf{\beta}_{k}^{T}\mathbf{x}を使ってモデルを定義することによって一般化することができる。} }

{\{\displaystyle\mu_{k}+\mathbf{\beta}_{k}^{T}\mathbf{x}}

の代わりにμ k+β T x{\displaystyle\mu_{k}+\mathbf{\beta}^{T}\mathbf{x}}

の代わりにμ k+β T x{\displaystyle\mu_{k}+\mathbf{\beta}^{T}\mathbf{x}}の代わりにμ k+β T x{\displaystyle\mu_{k} }

{\displaystyle mu_{k}+\mathbf{\beta}.{T}\mathbf{x}}

であり、これはモデルを序数データだけでなく(カテゴリが自然順序付けを持たない)名目データにも適している。 しかし、この一般化は、モデルをデータに適合させることをはるかに困難にする可能性があります。

ベースラインカテゴリー logit modelEdit

ベースラインカテゴリーモデルはlog λ=μ k+β k T x{\displaystyle\log\left=\mu_{k}+\mathbf{\beta}_{k}^{T}\mathbf{x}で定義される。} }

{\displaystyle mu_{k}+\mathbf{\beta}_{k}^{T}\mathbf{x}logはlog mu_{k}+\mathbf{\beta}_{K}+{T}logを意味します。} }

このモデルはカテゴリに順序付けを課すものではないため、ノミナルデータと順序データにも適用できます。{\Displaystyle\log\left=\mu_{k}+\phi_{k}\mathbf{\beta}^{T}\mathbf{x}{\displaystyle\log\left=\mu_{k}+\phi_{k}\mathbf{\beta}^{T}\mathbf{x}{\displaystyle\log\left=\mu_{k}+\phi_{k}\mathbf{\beta}^{T}\mathbf{x}{\displaystyle\log\left=\mu_{k}+\phi_{k}\mathbf{\beta}^{T}\mathbf{x}{{t}\mathbf{x}}で定義される。} }

{\ここで、スコアパラメータは0=√1√2√q=1{\displaystyle0=\phi_{1}\leq\phi_{2}\leq\dots\leq\phi_{q}}となるように制約される。}=1}

{\0=\phi_{1}\leq\phi_{2}\leq\dots\leq\phi_{q}qである。}=1}

.

これは、ベースラインカテゴリーロジットモデルよりも節約的で、より専門的なモデルである:ρ k β{\displaystyle\phi_{k}\mathbf{\beta}}} }

{\{\displaystyle\phi_{k}\mathbf{\beta}}

はβ k{\displaystyle\mathbf{\beta}_{k}}に似ていると考えることができる。}}

{\\mathbf{\beta}_{k}}

順序付けられていないステレオタイプモデルは順序付けられたステレオタイプモデルと同じ形をしているが、π k{\displaystyle\phi_{k}}に課された順序付けはない。}}

\ファイ_{k}

。 このモデルは、公称データに適用することができます。

フィットスコア、ρ^k{\displaystyle{\hat{\phi}}_{k}であることに注意してください}}

{\{\hat{\phi}}_{k}}

は、Y{\displaystyle Y}

Y

の異なるレベルを区別することがいかに簡単であるかを示している。 Φ k∈^k−1{\displaystyle{\hat{\phi}}_{k}\approx{\hat{\phi}}_{k}ならば、ϕ k∈^k∈^k−1{\displaystyle{\hat{\phi}}_{k}\approx{\hat{\phi-1}}

{\{\hat{\phi}}_{k}\approx{\hat{\phi}}_{k}\approx{\hat{\phi}}_{k}\approx{\hat{\phi-1}}

これは、共変量x{\displaystyle\mathbf{x}}

\mathbf{x}

の現在のデータ集合が、レベルk{\displaystyle k}を区別するための多くの情報を提供していないことを示しています}

k

そしてk−1{\displaystyle k−1}

k-1

であるが、それは必ずしも実際の値k{\displaystyle k}であることを意味するものではない。}

k

とk−1{\displaystyle k-1}

k-1

は遠く離れています。 共変量の値が変化すると、その新しいデータに対して適合スコアρ^k{\displaystyle{\hat{\phi}}_{k}}が得られる。}}

{\{\hat{\phi}}_{k}}

とπ^k−1{\displaystyle{\hat{\phi}}_{k}}とπ^k-1{\displaystyle{\hat{\phi}}_{k}}とπ^k-1{\displaystyle-1}}

{\{\hat{\phi}}_{k}}となる。-1}}

その後、遠く離れている可能性があります。

隣接圏logit modelEdit

隣接圏モデルはlog λ=μ k+β k T x{\displaystyle\log\left=\mu_{k}+\mathbf{\beta}_{k}^{T}\mathbf{x}で定義される。} }

最も一般的な形式であるが、Agresti(2010)では「比例オッズ形式」と呼ばれているが、log⁡=∑k+β T x{\displaystyle\log\left=\mu_{k}+\mathbf{\beta}^{T}\mathbf{x}}で定義される。} }

{\log\mu_{k}+\mathbf{\beta}^{T}\mathbf{x}}

\mu_{k}+\mathbf{\beta}^{T}\mathbf{x}

\mu_{k}+\mathbf

あるカテゴリから次のカテゴリへのシフトの確率をモデル化することは、それらのカテゴリの順序付けが存在することを意味するため、このモデ

隣接圏ロジットモデルは、β k=β(k−1){\displaystyle\mathbf{\beta}_{k}=\mathbf{\beta}(k)}であるベースラインカテゴリーロジットモデルの特別な場合と考えることができる。-1)}

{\displaystyle\mathbf{\beta}_{k}=\mathbf{\beta}(k)=を使用しています。-1)}

. 隣接圏ロジット模型は順序ステレオタイプ模型の特別な場合と考えることもでき、ここで∂k∈k−1{\displaystyle\phi_{k}\propto k-1}

{\displaystyle phi_{k}\propto k\phi_{k}\propto k displaystyle-1}

, すなわち、π k{\displaystyle\phi_{k}}

\phi_{k}

間の距離は、データに基づいて推定されるのではなく、事前に定義されている。

モデル間の比較編集

比例オッズモデルは、他の3つのモデルとは構造が非常に異なり、基本的な意味も異なります。 比例オッズモデルにおける基準圏の大きさはk{\displaystyle k}によって変化することに注意してください}

k

, Y≤k{\displaystyle Y\leq k}

{\displaystyle y\leq k}

はY>k{\displaystyle Y>k}

{\displaystyle Yk}

と比較されるからである。

コメントを残す

メールアドレスが公開されることはありません。

More: