Datos ordinales

Hay varios modelos diferentes que se pueden utilizar para describir la estructura de los datos ordinales. A continuación se describen cuatro clases principales de modelos, cada una definida para una variable aleatoria Y {\displaystyle Y}

$Y$

, con niveles indexados por k = 1 , 2 , … , q {\displaystyle k=1,2,\dots ,q}

$k=1,2,\dots ,q$

Tenga en cuenta que en las definiciones del modelo a continuación, los valores de μ k {\displaystyle \ mu _ {k}}

$\mu _ {k}$

y β {\displaystyle \mathbf {\beta } }

$\mathbf{\beta}$

no serán iguales para todos los modelos para el mismo conjunto de datos, pero la notación se usa para comparar la estructura de los diferentes modelos.

Modelo de probabilidades proporcionaleseditar
Modelo logit de categoría basaleditar
Modelo de estereotipo ordenadoeditar
categorías Adyacentes logit modelEdit
Comparaciones entre los modeloseditar

Modelo de probabilidades proporcionaleseditar

El modelo más utilizado para datos ordinales es el modelo de probabilidades proporcionaleseditar, definido por log ⁡ = log ⁡ = μ k + β T x {\displaystyle \log \ left= \ log \ left = \ mu _ {k}+\mathbf {\beta} ^{T}\mathbf {x} }

${\ \log \left=\log \left=\mu _{k}+\mathbf {\beta } ^{T}\mathbf {x} }$

donde los parámetros μ k {\displaystyle \mu _{k}}

$\mu _{k}$

describen la distribución base de los datos ordinales, x {\displaystyle \mathbf {x} }

$\mathbf {x}$

son las covariables y β {\displaystyle \mathbf {\beta } }

$\mathbf{\beta}$

son los coeficientes que describen los efectos de las covariables.

Este modelo se puede generalizar definiendo el modelo usando μ k + β k T x {\displaystyle \mu _ {k}+\mathbf {\beta} _{k}^{T}\mathbf {x} }

${\ \ mu _ {k}+\mathbf {\beta} _ {k}^{T}\mathbf {x}}$

en lugar de μ k + β T x {\displaystyle \mu _{k}+\mathbf {\beta} ^{T}\mathbf {x} }

$\mu _ {k}+\mathbf {\beta} ^{T}\mathbf {x}$

, y esto haría que el modelo sea adecuado para datos nominales (en los que las categorías no tienen un orden natural), así como para datos ordinales. Sin embargo, esta generalización puede hacer que sea mucho más difícil ajustar el modelo a los datos.

Modelo logit de categoría basaleditar

El modelo de categoría basaleditar se define por log ⁡ = μ k + β k T x {\displaystyle \log \ left = \ mu _ {k}+\mathbf {\beta} _ {k}^{T}\mathbf {x} }

$\log \ left= \ mu _{k}+\mathbf {\beta} _{k}^{T}\mathbf {x}$

Este modelo no impone un orden en las categorías y, por lo tanto, se puede aplicar a datos nominales y ordinales.

Modelo de estereotipo ordenadoeditar

El modelo de estereotipo ordenado se define por log ⁡ = μ k + k k β T x {\displaystyle \ log \ left= \ mu _ {k}+\phi _{k}\mathbf {\beta} ^{T}\mathbf {x} }

${\ \ log \ left= \ mu _ {k}+\phi _{k}\mathbf {\beta} ^{T}\mathbf {x}}$

donde los parámetros de puntuación están restringidos de tal manera que 0 = 0 1 ≤ ≤ 2 ≤ q ≤ q q = 1 {\displaystyle 0 = \phi _{1}\leq \phi _{2}\leq \dots \leq \phi _{q}=1}

$0 = \phi _{1}\leq \phi _{2}\leq \dots \leq \phi _{q}=1$

Este es un modelo más parsimonioso y especializado que el modelo logit de categoría base: ϕ k β {\displaystyle \ phi _{k}\mathbf {\beta } }

${\ \ phi _ {k}\mathbf {\beta}}$

puede considerarse similar a β k {\displaystyle \mathbf {\beta} _{k}}

$\mathbf {\beta} _ {k}$

El modelo de estereotipo no ordenado tiene la misma forma que el modelo de estereotipo ordenado, pero sin el orden impuesto a ϕ k {\displaystyle \ phi _{k}}

$\phi _ {k}$

. Este modelo se puede aplicar a datos nominales.

tenga en cuenta que el conjunto de puntuaciones, ϕ ^ k {\displaystyle {\hat {\phi }}_{k}}

${\hat {\phi }}_{k}$

, indicar cómo de fácil es distinguir entre los diferentes niveles de Y {\displaystyle Y}

$Y$

. Si ϕ ^ k ≈ ϕ ^ k − 1 {\displaystyle {\hat {\phi }}_{k}\approx {\hat {\phi }}_{k-1}}

${\hat {\phi }}_{k}\approx {\hat {\phi }}_{k-1}$

luego que indica que el actual conjunto de datos para las covariables x {\displaystyle \mathbf {x} }

$\mathbf {x}$

no proporcionan mucha información para distinguir entre los niveles de k {\displaystyle k}

$k$

y k − 1 {\displaystyle k-1}

$k-1$

, pero eso no necesariamente implica que los valores reales de k {\displaystyle k}

$k$

y k − 1 {\displaystyle k-1}

$k-1$

están lejos. Y si los valores de las covariables de cambio, para que los nuevos datos de la equipada con puntuaciones ϕ ^ k {\displaystyle {\hat {\phi }}_{k}}

${\hat {\phi }}_{k}$

y ϕ ^ k − 1 {\displaystyle {\hat {\phi }}_{k-1}}

${\hat {\phi }}_{k-1}$

podría ser entonces muy separados.

categorías Adyacentes logit modelEdit

Las categorías adyacentes modelo es definido por el registro de ⁡ = µ k + β k T x {\displaystyle \log \left=\mu _{k}+\mathbf {\beta } _{k}^{T}\mathbf {x} }

$\log \left=\mu _{k}+\mathbf {\beta } _{k}^{T}\mathbf {x}$

a pesar de que la forma más común, se refiere en Agresti (2010) como «proporcional probabilidades formulario» está definido en el registro de ⁡ = µ k + β T x {\displaystyle \log \left=\mu _{k}+\mathbf {\beta } ^{T}\mathbf {x} }

$\log \left=\mu _{k}+\mathbf {\beta } ^{T}\mathbf {x}$

Este modelo solo se puede aplicar a datos ordinales, ya que modelar las probabilidades de cambios de una categoría a la siguiente implica que existe un orden de esas categorías.

El modelo logit de categorías adyacentes se puede considerar como un caso especial del modelo logit de categoría base, donde β k = β (k − 1 ) {\displaystyle \mathbf {\beta } _{k}=\mathbf {\beta} (k-1)}

$\mathbf {\beta} _{k}=\mathbf {\beta} (k-1)$

. El modelo logit de categorías adyacentes también se puede considerar como un caso especial del modelo de estereotipo ordenado, donde ϕ k k k-1 {\displaystyle \ phi_{k} \ propto k-1}

$\phi _{k}\propto k-1$

, es decir, las distancias entre ϕ k {\displaystyle \phi _{k}}

$\phi _{k}$

se definen de antemano, en lugar de estimarse en base a los datos.

Comparaciones entre los modeloseditar

El modelo de probabilidades proporcionales tiene una estructura muy diferente a los otros tres modelos, y también un significado subyacente diferente. Tenga en cuenta que el tamaño de la categoría de referencia en el modelo de probabilidades proporcionales varía con k {\displaystyle k}

$k$

, dado que Y ≤ k {\displaystyle Y\leq k}

$Y \ leq k$

se compara con Y > k {\displaystyle Y> k}

$Yk$

Datos ordinales