Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

Modelos multinomiales jerárquicos

El resultado de una variable de respuesta puede ser a veces uno de un conjunto restringido de valores posibles. Si sólo hay dos resultados posibles, como masculino y femenino para el género, estas respuestas se denominan respuestas binarias. Si hay múltiples resultados, entonces se denominan respuestas polítomas. Estas respuestas son generalmente cualitativas en lugar de cuantitativas, como los distritos preferidos para vivir en una ciudad, el nivel de severidad de una enfermedad, la especie para un cierto tipo de flor, y así sucesivamente. Las respuestas politóseas también pueden tener categorías que no son independientes entre sí. En su lugar, la respuesta se produce de forma secuencial, o una categoría está anidada en la anterior. Estos tipos de respuestas se denominan, o.hierarchicalor sequentialnested multinomial responses

Por ejemplo, si la respuesta es el número de cigarrillos que una persona fuma en un día determinado, el primer nivel es si la persona es fumador o no. Dado que es fumador, el número de cigarrillos que fuma puede ser de uno a cinco o más de cinco al día. Dado que es más de 5, esta persona podría estar fumando de 6 a 10 o más de 10 cigarrillos al día, y así sucesivamente. El grupo de riesgo en cada nivel cambia en consecuencia. En el nivel uno, el grupo de riesgo es todos los individuos de interés (fumador o no), digamos.m Si fuera de las personas,my1 de ellos no son fumadores, a continuación, en el nivel dos, el grupo de riesgo es el número de todos los individuos fumadores, –my1. Siy2 de estos –my1 los individuos fuman de uno a cinco cigarrillos al día, luego en el nivel tres, el grupo de riesgo es –my1y2. Por lo tanto, en cada nivel, el número de personas en esa categoría se convierte en una observación binomial condicional.

Los modelos jerárquicos de regresión multinomial son extensiones de modelos de regresión binaria basadas en observaciones binarias condicionales. El valor predeterminado es un modelo con diferentes intercepción y pendientes (coeficientes) entre las categorías, en cuyo caso se ajusta a una secuencia de modelos binomiales condicionales.mnrfit El par nombre-valor especifica esto en.'interactions','on'mnrfit La función de enlace predeterminada es logit y el par nombre-valor especifica este modelo en.'link','logit'mnrfit

Supongamos que la probabilidad de que un individuo esté en la categoría dado que él o ella no está en las categorías anteriores esj Πj, y la probabilidad acumulada de que una respuesta pertenezca a una categoría o a una categoría anterior es P (≤jycj). A continuación, el modelo jerárquico con una función de enlace logit y diferentes pistas suposición es

ln(π11P(yc1))=ln(π11π1)=α1+β11X1+β12X2++β1pXp,ln(π21P(yc2))=ln(π21(π1+π2))=α2+β21X2+β22X2++β2pXp,ln(πk11P(yck1))=ln(πk11(π1++πk1))=αk1+β(k1)1X1+β(k1)2X2++β(k1)pXp.

Por ejemplo, para una variable de respuesta con cuatro categorías secuenciales, hay 4 – 1 = 3 ecuaciones de la siguiente manera:

ln(π1π+2π+3π4)=α1+β11X1+β12X2++β1pXp,ln(π2π+3π4)=α2+β21X1+β22X2++β2pXp,ln(π3π4)=α3+β31X1+β32X2++β3pXp.

Los coeficientesβij se interpretan dentro de cada nivel. Por ejemplo, para el ejemplo anterior de fumar,β12 muestra el impacto deX2 en las probabilidades de registro de que una persona sea fumador frente a un no fumador, siempre que todo lo demás se mantiene constante. Alternativamenteβ22 muestra el impacto deX2 en las cuotas de registro de una persona que fuma de uno a cinco cigarrillos frente a más de cinco cigarrillos al día, dado que él o ella es fumador, siempre que todo lo demás se mantiene constante. Semejantementeβ23, muestra el efecto deX2 en las probabilidades de registro de una persona que fuma de 6 a 10 cigarrillos frente a más de 10 cigarrillos al día, dado que él o ella fuma más de 5 cigarrillos al día, siempre que todo lo demás se mantiene constante.

Puede especificar otras funciones de enlace para modelos jerárquicos. El argumento de par nombre-valor utiliza la función de enlace probit.'link','probit' Con la suposición de las pendientes separadas, el modelo se convierte en

Φ1(π1)=α1+β11X1++β1pXp,Φ1(π2)=α2+β21X1++β2pXp,Φ1(πk)=αk+βk1X1++βkpXp,

Dóndeπj es la probabilidad condicional de estar en la categoría, dado que no está en categorías anteriores a la categoría.jj Y Φ-1(.) es la inversa de la función de distribución acumulativa normal estándar.

Después de estimar los coeficientes del modelo utilizando, puede estimar las probabilidades acumulativas o el número acumulado en cada categoría usando el argumento de par nombre-valor.mnrfitmnrval'type','conditional' La función acepta las estimaciones de coeficiente y devuelve las estadísticas del modelo, y estima las probabilidades categóricas o el número en cada categoría y sus límites de confianza.mnrvalmnrfit Puede especificar qué categoría o probabilidades acumulativas o números para estimar cambiando el valor del argumento de par nombre-valor en.'type'mnrval

Referencias

[1] McCullagh, P., and J. A. Nelder. Generalized Linear Models. New York: Chapman & Hall, 1990.

[2] Liao, T. F. Interpreting Probability Models: Logit, Probit, and Other Generalized Linear Models Series: Quantitative Applications in the Social Sciences. Sage Publications, 1994.

Consulte también

| | | |

Temas relacionados