Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

Modelos multinomial para las respuestas ordinales

El resultado de una variable de respuesta podría ser uno de un conjunto restringido de valores posibles. Si sólo hay dos resultados posibles, como masculino y femenino para el género, estas respuestas se denominan respuestas binarias. Si hay múltiples resultados, entonces se denominan respuestas polítomas. Algunos ejemplos de respuestas politomosas incluyen niveles de una enfermedad (leve, medio, severo), distritos preferidos para vivir en una ciudad, la especie para un cierto tipo de flor, y así sucesivamente. A veces puede haber un orden natural entre las categorías de respuesta. Estas respuestas se llaman.ordinal responses

El orden puede ser inherente a las opciones de categoría, como una persona que no está satisfecha, satisfecha o muy satisfecha con un servicio de atención al cliente en línea. El orden también podría ser introducido por la categorización de una variable latente (continua), como en el caso de un individuo que está en el bajo riesgo, riesgo medio, o grupo de alto riesgo para el desarrollo de una determinada enfermedad, basado en una medida médica cuantitativa como la sangre Presión.

Puede especificar un modelo de regresión multinomial que utilice el ordenamiento natural entre las categorías de respuesta. Este modelo ordinal describe la relación entre las probabilidades acumulativas de las categorías y las variables predictoras.

Diferentes funciones de enlace pueden describir esta relación con logit y probit siendo la más utilizada.

  • La función de enlace predeterminada se utiliza para las categorías ordinales es la función de enlace.Logit:mnrfitlogit Esto modela el.log cumulative odds El par nombre-valor especifica esto en.'link','logit'mnrfit Las cuotas acumuladas del registro son el logaritmo de la relación de la probabilidad de que una respuesta pertenezca a una categoría con un valor menor o igual a la categoría, P (≤jycj), y la probabilidad de que una respuesta pertenezca a una categoría con un valor mayor que la categoría, P (>jycj).

    Los modelos ordinales generalmente se basan en la suposición de que los efectos de las variables predictoras son los mismos para todas las categorías en la escala logarítmica. Es decir, el modelo tiene interceptos diferentes pero pendientes comunes (coeficientes) entre las categorías. Este modelo se llama o el modelo.parallel regressionproportional odds Es el valor predeterminado para las respuestas ordinales y el par nombre-valor especifica este modelo en.'interactions','off'mnrfit

    El modelo de cuotas proporcionales es

    ln(P(yc1)P(y>c1))=ln(π1π2++πk)=α1+β1X1+β2X2++βpXp,ln(P(yc2)P(y>c2))=ln(π1+π2π3++πk)=α2+β1X1+β2X2++βpXp,ln(P(yck1)P(y>ck1))=ln(π1+π2++πk1πk)=αk1+β1X1+β2X2++βpXp,

    Dónde Πj, = 1, 2,...,, son las probabilidades de categoría.jk

    Por ejemplo, para una variable de respuesta con tres categorías, hay 3 – 1 = 2 ecuaciones de la siguiente manera:

    ln(π1π+2π3)=α1+β1X1+β2X2++βpXp,ln(π+1π2π3)=α2+β1X1+β2X2++βpXp.

    En la suposición de cuotas proporcionales, el efecto parcial de una variable predictora es invariable a la elección de la categoría de variable de respuesta,.Xj Por ejemplo, si hay tres categorías, los coeficientes expresan el impacto de una variable predictora en el riesgo relativo o las probabilidades de registro del valor de respuesta que se encuentra en la categoría 1 frente a las categorías 2 o 3, o en la categoría 1 o 2 frente a la categoría 3.

    Por lo tanto, un cambio de unidad en variableX2 significaría un cambio en las probabilidades acumulativas del valor de respuesta en la categoría 1 frente a las categorías 2 o 3, o la categoría 1 o 2 versus la categoría 3 por un factor de exp (β2), dado que todo lo demás es igual.

    Alternativamente, puede ajustar un modelo con diferentes intercepción y pendientes entre las categorías mediante el argumento de par nombre-valor.'interactions','on' Sin embargo, el uso de esta opción para los modelos ordinales cuando el modelo de pendientes iguales es true provoca una pérdida de eficacia (se pierde la ventaja de estimar menos parámetros).

  • El argumento de par nombre-valor utiliza la función de enlace que se basa en una suposición de variable latente normalmente distribuida.Probit:'link','probit'probit Para las variables de respuesta ordinal, también se denomina modelo.ordered probit Considere el modelo de regresión que describe la relación de una variable latente * de un proceso ordinal y un vector de variables predictoras, yX

    y*=βX+ε,

    donde el término de error tiene una distribución normal estándar.ε Supongamos que existe la siguiente relación entre la variable latente * y la variable observada:yy

    y=c1ifα0<y*α1,y=c2ifα1<y*α2,y=ckifαk1<y*αk,

    Dóndeα0 = – ∞ yαk = ∞. Entonces, la probabilidad acumulada de estar en la categoría o una de las categorías anteriores, P (≤yjycj), es igual a

    P(ycj)=P(y*<αj)=P(βX+ε<αj)=P(ε<αjβX)=Φ(αjβX),

    donde Φ es la función de distribución acumulativa normal estándar. Así

    Φ1(P(ycj))=αjβX,

    Dónde Αj corresponde a los puntos de corte de la variable latente y la intercepción en el modelo de regresión. Esto sólo se mantiene bajo las suposiciones de una variable latente normal y una regresión paralela. En términos más generales, para una variable de respuesta con categorías y predictores múltiples, el modelo probit ordenado esk

    Φ1(P(yc1))=α1+β1X1++βpXp,Φ1(P(yc2))=α2+β1X1++βpXp,Φ1(P(yck1))=αk1+β1X1++βpXp,

    donde P (≤ycj) =π1 +π2 + ... +πj.

    Los coeficientes indican el impacto de un cambio de unidad en la variable predictora sobre la probabilidad de un estado. Un coeficiente positivo,β1, por ejemplo, indica un aumento en la variable latente subyacente con un aumento en la variable predictora correspondiente,X1. Por lo tanto, causa una disminución en P (≤yc1) y un aumento en P (≤yck).

Después de estimar los coeficientes del modelo utilizando, puede estimar las probabilidades acumulativas o el número acumulado en cada categoría usando la opción de par nombre-valor. acepta las estimaciones de coeficiente y devuelve las estadísticas del modelo, y estima las probabilidades categóricas o el número en cada categoría y sus intervalos de confianza.mnrfitmnrval'type','cumulative'mnrvalmnrfit Puede especificar qué categoría o probabilidades condicionales o números para estimar cambiando el valor del argumento de par nombre-valor.'type'

Referencias

[1] McCullagh, P., and J. A. Nelder. Generalized Linear Models. New York: Chapman & Hall, 1990.

[2] Long, J. S. Regression Models for Categorical and Limited Dependent Variables. Sage Publications, 1997.

[3] Dobson, A. J., and A. G. Barnett. An Introduction to Generalized Linear Models. Chapman and Hall/CRC. Taylor & Francis Group, 2008.

Consulte también

| | | |

Temas relacionados