Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

mnrfit

La regresión logística multinomial

Descripción

ejemplo

B = mnrfit(X,Y) Devuelve una matriz, de estimaciones de coeficiente para una regresión logística multinomial de las respuestas nominales en los predictores en.BYX

ejemplo

B = mnrfit(X,Y,Name,Value) Devuelve una matriz, de estimaciones de coeficiente para un modelo multinomial que se ajustan a opciones adicionales especificadas por uno o más argumentos de par.BName,Value

Por ejemplo, puede ajustar un modelo nominal, ordinal o jerárquico, o bien cambiar la función de enlace.

ejemplo

[B,dev,stats] = mnrfit(___) también devuelve la desviación del ajuste y la estructura de cualquiera de los argumentos de entrada anteriores. contiene estadísticas de modelo, como grados de libertad, errores estándar para estimaciones de coeficiente y residuales.devstatsstats

Ejemplos

contraer todo

Ajuste una regresión multinomial para obtener resultados nominales e interprete los resultados.

Cargue los datos de ejemplo.

load fisheriris

El vector de columna,, consiste en flores de iris de tres especies diferentes, setosa, versicolor, virginica.species La doble matriz consta de cuatro tipos de mediciones en las flores, la longitud y anchura de sépalos y pétalos en centímetros, respectivamente.meas

Defina la variable de respuesta nominal utilizando una matriz categórica.

sp = categorical(species);

Ajuste un modelo de regresión multinomial para predecir la especie utilizando las mediciones.

[B,dev,stats] = mnrfit(meas,sp); B
B = 5×2
103 ×

    2.2103    0.0426
    0.7376    0.0025
   -0.6215    0.0067
   -0.5659   -0.0094
   -3.0210   -0.0183

Este es un modelo nominal para los riesgos relativos de la categoría de respuesta, con pendientes separadas en los cuatro predictores, es decir, cada categoría de.meas La primera fila contiene los términos de intercepción para el riesgo relativo de las dos primeras categorías de respuesta, setosa y versicolor versus la categoría de referencia, virginica.B Las últimas cuatro filas contienen las pendientes para los modelos de las dos primeras categorías. acepta la tercera categoría como categoría de referencia.mnrfit

El riesgo relativo de una flor de iris es la especie 2 (versicolor) versus la especie 3 (virginica) es la relación de las dos probabilidades (la probabilidad de ser especies 2 y la probabilidad de ser especies 3). El modelo para el riesgo relativo es

<math display="block">
<mrow>
<mi mathvariant="normal">ln</mi>
<mrow>
<mo>(</mo>
<mrow>
<mfrac>
<mrow>
<mrow>
<mrow>
<msub>
<mrow>
<mi>π</mi>
</mrow>
<mrow>
<mstyle mathvariant="normal">
<mrow>
<mrow>
<mi>v</mi>
<mi>e</mi>
<mi>r</mi>
<mi>s</mi>
<mi>i</mi>
<mi>c</mi>
<mi>o</mi>
<mi>l</mi>
<mi>o</mi>
<mi>r</mi>
</mrow>
</mrow>
</mstyle>
</mrow>
</msub>
</mrow>
</mrow>
</mrow>
<mrow>
<mrow>
<mrow>
<msub>
<mrow>
<mi>π</mi>
</mrow>
<mrow>
<mstyle mathvariant="normal">
<mrow>
<mrow>
<mi>v</mi>
<mi>i</mi>
<mi>r</mi>
<mi>g</mi>
<mi>i</mi>
<mi>n</mi>
<mi>i</mi>
<mi>c</mi>
<mi>a</mi>
</mrow>
</mrow>
</mstyle>
</mrow>
</msub>
</mrow>
</mrow>
</mrow>
</mfrac>
</mrow>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mn>4</mn>
<mn>2</mn>
<mo>.</mo>
<mn>6</mn>
<mo>+</mo>
<mn>2</mn>
<mo>.</mo>
<mn>5</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mn>1</mn>
</mrow>
</msub>
</mrow>
<mo>+</mo>
<mn>6</mn>
<mo>.</mo>
<mn>7</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mn>2</mn>
</mrow>
</msub>
</mrow>
<mo>-</mo>
<mn>9</mn>
<mo>.</mo>
<mn>4</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mn>3</mn>
</mrow>
</msub>
</mrow>
<mo>-</mo>
<mn>1</mn>
<mn>8</mn>
<mo>.</mo>
<mn>3</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mn>4</mn>
</mrow>
</msub>
</mrow>
<mo>.</mo>
</mrow>
</math>

Los coeficientes expresan tanto los efectos de las variables predictoras en el riesgo relativo como las probabilidades de registro de estar en una categoría frente a la categoría de referencia. Por ejemplo, el coeficiente estimado 2,5 indica que el riesgo relativo de ser especies 2 (versicolor) versus especies 3 (virginica) aumenta exp (2.5) veces por cada aumento de unidad en

<math display="block">
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mn>1</mn>
</mrow>
</msub>
</mrow>
</math>
, la primera medida, dado todo lo demás es igual. Las probabilidades de registro relativas de ser versicolor versus virginica aumenta 2,5 veces con un aumento de una unidad en
<math display="block">
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mn>1</mn>
</mrow>
</msub>
</mrow>
</math>
, dado que todo lo demás es igual.

Si los coeficientes están convergiendo hacia infinito o infinito negativo, los coeficientes estimados pueden variar ligeramente dependiendo del sistema operativo.

Compruebe la significancia estadística de los coeficientes del modelo.

stats.p
ans = 5×2

         0    0.0000
         0    0.0281
         0    0.0000
         0    0.0000
         0    0.0000

El pequeño

<math display="block">
<mrow>
<mi>p</mi>
</mrow>
</math>
-los valores indican que todas las medidas son significativas en el riesgo relativo de ser una setosa versus una virginica (especie 1 comparada con la especie 3) y ser una versicolor versus una virginica (especie 2 comparada con la especie 3).

Solicitar los errores estándar de las estimaciones de coeficiente.

stats.se
ans = 5×2

   12.4038    5.2719
    3.5783    1.1228
    3.1760    1.4789
    3.5403    1.2934
    7.1203    2.0967

Calcule los límites de confianza del 95% para los coeficientes.

LL = stats.beta - 1.96.*stats.se; UL = stats.beta + 1.96.*stats.se;

Mostrar los intervalos de confianza para los coeficientes del modelo para el riesgo relativo de ser una setosa versus una virginica (la primera columna de coeficientes en).B

[LL(:,1) UL(:,1)]
ans = 5×2
103 ×

    2.1860    2.2346
    0.7306    0.7446
   -0.6277   -0.6153
   -0.5728   -0.5590
   -3.0350   -3.0071

Encuentre los intervalos de confianza para los coeficientes del modelo para el riesgo relativo de ser un versicolor versus una virginica (la segunda columna de coeficientes en).B

[LL(:,2) UL(:,2)]
ans = 5×2

   32.3049   52.9707
    0.2645    4.6660
    3.7823    9.5795
  -11.9644   -6.8944
  -22.3957  -14.1766

Ajuste un modelo de regresión multinomial para respuestas categóricas con ordenación natural entre categorías.

Cargue los datos de muestra y defina las variables predictoras.

load carbig X = [Acceleration Displacement Horsepower Weight];

Las variables predictoras son la aceleración, el desplazamiento del motor, la potencia y el peso de los coches. La variable de respuesta es millas por galón (MPG).

Cree una variable de respuesta ordinal categorizando en cuatro niveles de 9 a 48 MPG etiquetando los valores de respuesta en el rango 9-19 como 1, 20-29 como 2, 30-39 como 3 y 40-48 como 4.MPG

miles = ordinal(MPG,{'1','2','3','4'},[],[9,19,29,39,48]);

Ajuste un modelo de respuesta ordinal para la variable de respuesta.miles

[B,dev,stats] = mnrfit(X,miles,'model','ordinal'); B
B = 7×1

  -16.6895
  -11.7208
   -8.0606
    0.1048
    0.0103
    0.0645
    0.0017

Los tres primeros elementos de son los términos de intercepción para los modelos, y los últimos cuatro elementos de son los coeficientes de las covariables, asumido común en todas las categorías.BB Este modelo corresponde a, que también se llama el modelo, donde hay una intercepción diferente pero pistas comunes entre las categorías.parallel regressionproportional odds Puede especificar esto mediante el argumento de par nombre-valor, que es el valor predeterminado para los modelos ordinales.'interactions','off'

[B(1:3)'; repmat(B(4:end),1,3)]
ans = 5×3

  -16.6895  -11.7208   -8.0606
    0.1048    0.1048    0.1048
    0.0103    0.0103    0.0103
    0.0645    0.0645    0.0645
    0.0017    0.0017    0.0017

La función de vínculo en el modelo es logit (), que es el valor predeterminado para un modelo ordinal.'link','logit' Los coeficientes expresan el riesgo relativo o las probabilidades de registro del MPG de un coche que es menor o igual a un valor versus mayor que ese valor.

El modelo de cuotas proporcionales en este ejemplo es

<math display="block">
<mrow>
<mtable columnalign="left">
<mtr>
<mtd>
<mrow>
<mi mathvariant="normal">ln</mi>
<mrow>
<mo>(</mo>
<mrow>
<mfrac>
<mrow>
<mrow>
<mi>P</mi>
<mrow>
<mo>(</mo>
<mrow>
<mi>m</mi>
<mi>p</mi>
<mi>g</mi>
<mo></mo>
<mn>1</mn>
<mn>9</mn>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
</mrow>
<mrow>
<mrow>
<mi>P</mi>
<mrow>
<mo>(</mo>
<mrow>
<mi>m</mi>
<mi>p</mi>
<mi>g</mi>
<mo>></mo>
<mn>1</mn>
<mn>9</mn>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
</mrow>
</mfrac>
</mrow>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mo>-</mo>
<mn>1</mn>
<mn>6</mn>
<mo>.</mo>
<mn>6</mn>
<mn>8</mn>
<mn>9</mn>
<mn>5</mn>
<mo>+</mo>
<mn>0</mn>
<mo>.</mo>
<mn>1</mn>
<mn>0</mn>
<mn>4</mn>
<mn>8</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>A</mi>
</mrow>
</msub>
</mrow>
<mo>+</mo>
<mn>0</mn>
<mo>.</mo>
<mn>0</mn>
<mn>1</mn>
<mn>0</mn>
<mn>3</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>D</mi>
</mrow>
</msub>
</mrow>
<mo>+</mo>
<mn>0</mn>
<mo>.</mo>
<mn>0</mn>
<mn>6</mn>
<mn>4</mn>
<mn>5</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>H</mi>
</mrow>
</msub>
</mrow>
<mo>+</mo>
<mn>0</mn>
<mo>.</mo>
<mn>0</mn>
<mn>0</mn>
<mn>1</mn>
<mn>7</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>W</mi>
</mrow>
</msub>
</mrow>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow></mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mi mathvariant="normal">ln</mi>
<mrow>
<mo>(</mo>
<mrow>
<mfrac>
<mrow>
<mrow>
<mi>P</mi>
<mrow>
<mo>(</mo>
<mrow>
<mi>m</mi>
<mi>p</mi>
<mi>g</mi>
<mo></mo>
<mn>2</mn>
<mn>9</mn>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
</mrow>
<mrow>
<mrow>
<mi>P</mi>
<mrow>
<mo>(</mo>
<mrow>
<mi>m</mi>
<mi>p</mi>
<mi>g</mi>
<mo>></mo>
<mn>2</mn>
<mn>9</mn>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
</mrow>
</mfrac>
</mrow>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mo>-</mo>
<mn>1</mn>
<mn>1</mn>
<mo>.</mo>
<mn>7</mn>
<mn>2</mn>
<mn>0</mn>
<mn>8</mn>
<mo>+</mo>
<mn>0</mn>
<mo>.</mo>
<mn>1</mn>
<mn>0</mn>
<mn>4</mn>
<mn>8</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>A</mi>
</mrow>
</msub>
</mrow>
<mo>+</mo>
<mn>0</mn>
<mo>.</mo>
<mn>0</mn>
<mn>1</mn>
<mn>0</mn>
<mn>3</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>D</mi>
</mrow>
</msub>
</mrow>
<mo>+</mo>
<mn>0</mn>
<mo>.</mo>
<mn>0</mn>
<mn>6</mn>
<mn>4</mn>
<mn>5</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>H</mi>
</mrow>
</msub>
</mrow>
<mo>+</mo>
<mn>0</mn>
<mo>.</mo>
<mn>0</mn>
<mn>0</mn>
<mn>1</mn>
<mn>7</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>W</mi>
</mrow>
</msub>
</mrow>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow></mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mi mathvariant="normal">ln</mi>
<mrow>
<mo>(</mo>
<mrow>
<mfrac>
<mrow>
<mrow>
<mi>P</mi>
<mrow>
<mo>(</mo>
<mrow>
<mi>m</mi>
<mi>p</mi>
<mi>g</mi>
<mo></mo>
<mn>3</mn>
<mn>9</mn>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
</mrow>
<mrow>
<mrow>
<mi>P</mi>
<mrow>
<mo>(</mo>
<mrow>
<mi>m</mi>
<mi>p</mi>
<mi>g</mi>
<mo>></mo>
<mn>3</mn>
<mn>9</mn>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
</mrow>
</mfrac>
</mrow>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mo>-</mo>
<mn>8</mn>
<mo>.</mo>
<mn>0</mn>
<mn>6</mn>
<mn>0</mn>
<mn>6</mn>
<mo>+</mo>
<mn>0</mn>
<mo>.</mo>
<mn>1</mn>
<mn>0</mn>
<mn>4</mn>
<mn>8</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>A</mi>
</mrow>
</msub>
</mrow>
<mo>+</mo>
<mn>0</mn>
<mo>.</mo>
<mn>0</mn>
<mn>1</mn>
<mn>0</mn>
<mn>3</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>D</mi>
</mrow>
</msub>
</mrow>
<mo>+</mo>
<mn>0</mn>
<mo>.</mo>
<mn>0</mn>
<mn>6</mn>
<mn>4</mn>
<mn>5</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>H</mi>
</mrow>
</msub>
</mrow>
<mo>+</mo>
<mn>0</mn>
<mo>.</mo>
<mn>0</mn>
<mn>0</mn>
<mn>1</mn>
<mn>7</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>W</mi>
</mrow>
</msub>
</mrow>
</mrow>
</mtd>
</mtr>
</mtable>
</mrow>
</math>

Por ejemplo, la estimación de coeficiente de 0,1048 indica que un cambio de unidad en la aceleración afectaría a las probabilidades de que el MPG de un automóvil sea menor o igual a 19 frente a más de 19, o que sea menor o igual a 29 versus mayor que 29 , o ser menor o igual a 39 versus mayor que 39, por un factor de exp (0.01048) dado todo lo demás es igual.

Evalúe la importancia de los coeficientes.

stats.p
ans = 7×1

    0.0000
    0.0000
    0.0000
    0.1899
    0.0350
    0.0000
    0.0118

el

<math display="block">
<mrow>
<mi>p</mi>
</mrow>
</math>
-los valores de 0,035, 0,0000, y 0,0118 para el desplazamiento del motor, caballos de fuerza, y el peso de un coche, respectivamente, indican que estos factores son significativos en las probabilidades de MPG de un coche que es menor o igual a un cierto valor versus ser mayor que ese valor.

Ajuste un modelo de regresión multinomial jerárquico.

Cargue los datos de ejemplo.

load(fullfile(matlabroot,'examples','stats','smoking.mat'));

El conjunto de datos contiene cinco variables: sexo, edad, peso, y la presión arterial sistólica y diastólica.smoking El sexo es una variable binaria donde 1 indica pacientes femeninos, y 0 indica pacientes masculinos.

Defina la variable de respuesta.

Y = categorical(smoking.Smoker);

Los datos en tiene cuatro categorías:Smoker

  • 0 No fumador, 0 cigarrillos al día

  • 1: Fumador, 1 – 5 cigarrillos al día

  • 2: Fumador, 6 – 10 cigarrillos al día

  • 3: Fumador, 11 o más cigarrillos al día

Defina las variables predictoras.

X = [smoking.Sex smoking.Age smoking.Weight...     smoking.SystolicBP smoking.DiastolicBP];

Ajuste un modelo multinomial jerárquico.

[B,dev,stats] = mnrfit(X,Y,'model','hierarchical'); B
B = 6×3

   43.8148    5.9571   44.0712
    1.8709   -0.0230    0.0662
    0.0188    0.0625    0.1335
    0.0046   -0.0072   -0.0130
   -0.2170    0.0416   -0.0324
   -0.2273   -0.1449   -0.4824

La primera columna incluye la interceptación y las estimaciones del coeficiente para el modelo del riesgo relativo de ser un no fumador frente a un fumador.B La segunda columna incluye las estimaciones de parámetros para modelar las probabilidades de registro de fumar de 1 a 5 cigarrillos al día frente a más de cinco cigarrillos al día, dado que una persona es fumador. Finalmente, la tercera columna incluye las estimaciones de parámetros para modelar las probabilidades de registro de una persona que fuma de 6 a 10 cigarrillos al día frente a más de 10 cigarrillos al día, dado que fuma más de 5 cigarrillos al día.

Los coeficientes difieren entre categorías. Puede especificar esto mediante el argumento de par nombre-valor, que es el valor predeterminado para los modelos jerárquicos.'interactions','on' Por lo tanto, el modelo en este ejemplo es

<math display="block">
<mrow>
<mi mathvariant="normal">ln</mi>
<mrow>
<mo>(</mo>
<mrow>
<mfrac>
<mrow>
<mrow>
<mi>P</mi>
<mrow>
<mo>(</mo>
<mrow>
<mi>y</mi>
<mo>=</mo>
<mn>0</mn>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
</mrow>
<mrow>
<mrow>
<mi>P</mi>
<mrow>
<mo>(</mo>
<mrow>
<mi>y</mi>
<mo>></mo>
<mn>0</mn>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
</mrow>
</mfrac>
</mrow>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mn>4</mn>
<mn>3</mn>
<mo>.</mo>
<mn>8</mn>
<mn>1</mn>
<mn>4</mn>
<mn>8</mn>
<mo>+</mo>
<mn>1</mn>
<mo>.</mo>
<mn>8</mn>
<mn>7</mn>
<mn>0</mn>
<mn>9</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>S</mi>
</mrow>
</msub>
</mrow>
<mo>+</mo>
<mn>0</mn>
<mo>.</mo>
<mn>0</mn>
<mn>1</mn>
<mn>8</mn>
<mn>8</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>A</mi>
</mrow>
</msub>
</mrow>
<mo>+</mo>
<mn>0</mn>
<mo>.</mo>
<mn>0</mn>
<mn>0</mn>
<mn>4</mn>
<mn>6</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>W</mi>
</mrow>
</msub>
</mrow>
<mo>-</mo>
<mn>0</mn>
<mo>.</mo>
<mn>2</mn>
<mn>1</mn>
<mn>7</mn>
<mn>0</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>S</mi>
<mi>B</mi>
<mi>P</mi>
</mrow>
</msub>
</mrow>
<mo>-</mo>
<mn>0</mn>
<mo>.</mo>
<mn>2</mn>
<mn>2</mn>
<mn>7</mn>
<mn>3</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>D</mi>
<mi>B</mi>
<mi>P</mi>
</mrow>
</msub>
</mrow>
</mrow>
</math>

<math display="block">
<mrow>
<mi mathvariant="normal">ln</mi>
<mrow>
<mo>(</mo>
<mrow>
<mfrac>
<mrow>
<mrow>
<mi>P</mi>
<mrow>
<mo>(</mo>
<mrow>
<mn>1</mn>
<mo></mo>
<mi>y</mi>
<mo></mo>
<mn>5</mn>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
</mrow>
<mrow>
<mrow>
<mi>P</mi>
<mrow>
<mo>(</mo>
<mrow>
<mi>y</mi>
<mo>></mo>
<mn>5</mn>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
</mrow>
</mfrac>
</mrow>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mn>5</mn>
<mo>.</mo>
<mn>9</mn>
<mn>5</mn>
<mn>7</mn>
<mn>1</mn>
<mo>-</mo>
<mn>0</mn>
<mo>.</mo>
<mn>0</mn>
<mn>2</mn>
<mn>3</mn>
<mn>0</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>S</mi>
</mrow>
</msub>
</mrow>
<mo>+</mo>
<mn>0</mn>
<mo>.</mo>
<mn>0</mn>
<mn>6</mn>
<mn>2</mn>
<mn>5</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>A</mi>
</mrow>
</msub>
</mrow>
<mo>-</mo>
<mn>0</mn>
<mo>.</mo>
<mn>0</mn>
<mn>0</mn>
<mn>7</mn>
<mn>2</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>W</mi>
</mrow>
</msub>
</mrow>
<mo>+</mo>
<mn>0</mn>
<mo>.</mo>
<mn>0</mn>
<mn>4</mn>
<mn>1</mn>
<mn>6</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>S</mi>
<mi>B</mi>
<mi>P</mi>
</mrow>
</msub>
</mrow>
<mo>-</mo>
<mn>0</mn>
<mo>.</mo>
<mn>1</mn>
<mn>4</mn>
<mn>4</mn>
<mn>9</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>D</mi>
<mi>B</mi>
<mi>P</mi>
</mrow>
</msub>
</mrow>
</mrow>
</math>

<math display="block">
<mrow>
<mi mathvariant="normal">ln</mi>
<mrow>
<mo>(</mo>
<mrow>
<mfrac>
<mrow>
<mrow>
<mi>P</mi>
<mrow>
<mo>(</mo>
<mrow>
<mn>6</mn>
<mo></mo>
<mi>y</mi>
<mo></mo>
<mn>1</mn>
<mn>0</mn>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
</mrow>
<mrow>
<mrow>
<mi>P</mi>
<mrow>
<mo>(</mo>
<mrow>
<mi>y</mi>
<mo>></mo>
<mn>1</mn>
<mn>0</mn>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
</mrow>
</mfrac>
</mrow>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mn>4</mn>
<mn>4</mn>
<mo>.</mo>
<mn>0</mn>
<mn>7</mn>
<mn>1</mn>
<mn>2</mn>
<mo>+</mo>
<mn>0</mn>
<mo>.</mo>
<mn>0</mn>
<mn>6</mn>
<mn>6</mn>
<mn>2</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>S</mi>
</mrow>
</msub>
</mrow>
<mo>+</mo>
<mn>0</mn>
<mo>.</mo>
<mn>1</mn>
<mn>3</mn>
<mn>3</mn>
<mn>5</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>A</mi>
</mrow>
</msub>
</mrow>
<mo>-</mo>
<mn>0</mn>
<mo>.</mo>
<mn>0</mn>
<mn>1</mn>
<mn>3</mn>
<mn>0</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>W</mi>
</mrow>
</msub>
</mrow>
<mo>-</mo>
<mn>0</mn>
<mo>.</mo>
<mn>0</mn>
<mn>3</mn>
<mn>2</mn>
<mn>4</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>S</mi>
<mi>B</mi>
<mi>P</mi>
</mrow>
</msub>
</mrow>
<mo>-</mo>
<mn>0</mn>
<mo>.</mo>
<mn>4</mn>
<mn>8</mn>
<mn>2</mn>
<mn>4</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>D</mi>
<mi>B</mi>
<mi>P</mi>
</mrow>
</msub>
</mrow>
</mrow>
</math>

Por ejemplo, la estimación del coeficiente de 1,8709 indica que la probabilidad de ser fumador versus un no fumador aumenta en exp (1.8709) = 6,49 veces a medida que el género cambia de hembra a macho dado que todo lo demás se mantiene constante.

Evaluar la significación estadística de los términos.

stats.p
ans = 6×3

    0.0000    0.5363    0.2149
    0.3549    0.9912    0.9835
    0.6850    0.2676    0.2313
    0.9032    0.8523    0.8514
    0.0009    0.5187    0.8165
    0.0004    0.0483    0.0545

El sexo, la edad o el peso no parecen significativos en ningún nivel. el

<math display="block">
<mrow>
<mi>p</mi>
</mrow>
</math>
-los valores de 0,0009 y 0,0004 indican que ambos tipos de presión arterial son significativos en el riesgo relativo de que una persona sea fumador frente a un no fumador. el
<math display="block">
<mrow>
<mi>p</mi>
</mrow>
</math>
-el valor de 0,0483 muestra que sólo la presión arterial diastólica es significativa en las probabilidades de que una persona fume de 0 a 5 cigarrillos al día frente a más de 5 cigarrillos al día. Del mismo modo, el
<math display="block">
<mrow>
<mi>p</mi>
</mrow>
</math>
-valor de 0,0545 indica que la presión arterial diastólica es significativa en las probabilidades de que una persona fume de 6 a 10 cigarrillos al día frente a más de 10 cigarrillos al día.

Compruebe si hay factores no significativos que se correlacionan entre sí. Dibuja un diagrama de dispersión de la edad versus el peso agrupado por sexo.

figure() gscatter(smoking.Age,smoking.Weight,smoking.Sex) legend('Male','Female') xlabel('Age') ylabel('Weight')

El rango de peso de un individuo parece diferir según el género. La edad no parece tener ninguna correlación obvia con el sexo o el peso. La edad es insignificante y el peso parece estar correlacionado con el sexo, por lo que puede eliminar ambos y reconstruir el modelo.

Eliminar la edad y el peso del modelo y ajustar un modelo jerárquico con el sexo, la presión arterial sistólica, y la presión arterial diastólica como las variables predictoras.

X = double([smoking.Sex smoking.SystolicBP... smoking.DiastolicBP]); [B,dev,stats] = mnrfit(X,Y,'model','hierarchical'); B
B = 4×3

   44.8456    5.3230   25.0248
    1.6045    0.2330    0.4982
   -0.2161    0.0497    0.0179
   -0.2222   -0.1358   -0.3092

Aquí, una estimación de coeficiente de 1,6045 indica que la probabilidad de ser un no fumador versus un fumador aumenta por exp (1.6045) = 4,97 veces mientras el sexo cambia de macho a hembra. Un aumento de la unidad en la presión arterial sistólica indica una exp (–. 2161) = 0,8056 disminución en la probabilidad de ser un no fumador versus un fumador. Del mismo modo, un aumento de la unidad en la presión arterial diastólica indica una exp (–. 2222) = 0,8007 disminución en la tasa relativa de ser un no fumador versus ser fumador.

Evaluar la significación estadística de los términos.

stats.p
ans = 4×3

    0.0000    0.4715    0.2325
    0.0210    0.7488    0.6362
    0.0010    0.4107    0.8899
    0.0003    0.0483    0.0718

el

<math display="block">
<mrow>
<mi>p</mi>
</mrow>
</math>
-los valores de 0,0210, 0,0010, y 0,0003 indican que los términos sexo y ambos tipos de presión arterial son significativos en el riesgo relativo de que una persona sea un no fumador versus un fumador, dados los otros términos en el modelo. Basado en la
<math display="block">
<mrow>
<mi>p</mi>
</mrow>
</math>
-valor de 0,0483, la presión arterial diastólica parece significativa en el riesgo relativo de una persona que fuma 1 – 5 cigarrillos frente a más de 5 cigarrillos al día, dado que esta persona es fumador. Porque ninguno de los
<math display="block">
<mrow>
<mi>p</mi>
</mrow>
</math>
-los valores de la tercera columna son inferiores a 0,05, se puede decir que ninguna de las variables son estadísticamente significativas en el riesgo relativo de una persona que fuma de 6 a 10 cigarrillos frente a más de 10 cigarrillos, dado que esta persona fuma más de 5 cigarrillos al día.

Argumentos de entrada

contraer todo

Observaciones sobre variables predictoras, especificadas como una-por-matriz. contiene observaciones para los predictores.npXnp

Nota

incluye automáticamente un término constante (intercepción) en todos los modelos.mnrfit No incluya una columna de 1s en.X

Tipos de datos: single | double

Valores de respuesta, especificados como un vector de columna o una matriz. puede ser uno de los siguientes:Y

  • Una-por-matriz, donde (,) es el número de resultados de la categoría multinomial para las combinaciones predictoras dadas por (,:).nk Yijj Xi En este caso, el número de observaciones se realiza en cada combinación de predictor.

  • Vector de columna de un-por-1 de enteros escalares de 1 a que indica el valor de la respuesta para cada observación.nk En este caso, todos los tamaños de muestra son 1.

  • Matriz categórica de an-by-1 que indica el valor nominal o ordinal de la respuesta para cada observación.n En este caso, todos los tamaños de muestra son 1.

Argumentos de par nombre-valor

Especifique pares de argumentos separados por comas opcionales. es el nombre del argumento y es el valor correspondiente. deben aparecer dentro de las cotizaciones.Name,ValueNameValueName Puede especificar varios argumentos de par de nombre y valor en cualquier orden como.Name1,Value1,...,NameN,ValueN

Ejemplo: especifica un modelo ordinal con una función de enlace de probit.'Model','ordinal','Link','probit'

Tipo de modelo que se ajusta, especificado como el par separado por comas que consta de y uno de los siguientes.'Model'

'nominal'Predeterminado. No hay ningún orden entre las categorías de respuesta.
'ordinal'Hay un ordenamiento natural entre las categorías de respuesta.
'hierarchical'La elección de la categoría de respuesta es secuencial/anidada.

Ejemplo: 'Model','ordinal'

Indicador para una interacción entre las categorías y los coeficientes multinomiales, especificado como el par separado por comas que consta de uno de los siguientes.'Interactions'

'on'Valor predeterminado para modelos nominales y jerárquicos. Ajuste un modelo con diferentes coeficientes entre categorías.
'off'Valor predeterminado para los modelos ordinales. Ajuste un modelo con un conjunto común de coeficientes para las variables predictoras, en todas las categorías multinomiales. Esto se describe a menudo como o el.parallel regressionproportional odds model

En todos los casos, el modelo tiene Interceptas diferentes entre categorías. La elección de determina las dimensiones de la matriz de salida.'Interactions'B

Ejemplo: 'Interactions','off'

Indicador para estimar un parámetro de dispersión, especificado como el par separado por comas que consta de y uno de los siguientes.'EstDisp'

'off'Predeterminado. Utilice el valor de dispersión teórica de 1.
'on'Estime un parámetro de dispersión para la distribución multinomial en los errores estándar de cálculo.

Ejemplo: 'EstDisp','on'

Argumentos de salida

contraer todo

Estimaciones de coeficiente para una regresión logística multinomial de las respuestas en, devueltas como un vector o una matriz.Y

  • Si es, entonces es un-1 + vector.'Interaction''off'Bkp La primera – 1 filas corresponden a los términos de intercepción, una para cada uno – 1 categorías multinomiales, y las filas restantes corresponden a los coeficientes predictores, que son comunes para todas las primeras – 1 categorías.kBkpk

  • Si es, entonces es una (+ 1)-por-(– 1) matriz.'Interaction''on'Bpk Cada columna corresponde al término de interceptación Estimado y a los coeficientes predictores, uno para cada una de las primeras-1 categorías multinomiales.Bk

Las estimaciones para la categoría TH se toman como cero, ya que toma la última categoría como categoría de referencia.kmnrfit

Desviación del ajuste, devuelta como un valor escalar. Es el doble de la diferencia entre la probabilidad de registro máxima alcanzable y la alcanzada bajo el modelo ajustado. Esto corresponde a la suma de los residuos de desviación,

dev=2*injkyij*log(yijπ^ij*mi)=inrdi,

Dónderdi son los residuales de desviación. Para los residuales de desviación ver.stats

Estadísticas del modelo, devueltas como una estructura que contiene los siguientes campos.

betaEl coeficiente estima. Estos son los mismos que.B
dfe

Grados de libertad de error

  • Si es así, entonces grados de libertad es * (– 1) – (– 1 +).'Interactions''off'nkkp

  • Si es así, entonces grados de libertad es (– + 1) * (– 1).'Interactions''on'npk

sfitParámetro de dispersión estimado.
s

Parámetro de dispersión teórico o estimado.

  • Si es, entonces es el parámetro de dispersión teórica, 1.'Estdisp''off's

  • Si es, entonces es igual al parámetro de dispersión estimado,.'Estdisp''on'ssfit

estdispIndicador de un parámetro de dispersión teórico o estimado.
seErrores estándar de estimaciones de coeficiente,.B
coeffcorrMatriz de correlación estimada para.B
covbMatriz de covarianza estimada para.B
testadísticas para.tB
p-valores para.pB
resid

Residuos brutos. Observados menos valores ajustados,

rij=yijπ^ij*mi,{i=1,,nj=1,,k,

Dóndeπij es la probabilidad categórica, acumulativa o condicional, ymi es el tamaño de muestra correspondiente.

residp

Los residuales de Pearson, que son los residuales brutos escalados por la desviación estándar estimada:

rpij=rijσ^ij=yijπ^ij*miπ^ij*(1π^ij)*mi,{i=1,,nj=1,,k,

Dóndeπij es la probabilidad categórica, acumulativa o condicional, ymi es el tamaño de muestra correspondiente.

residd

Residuos de desviación:

rdi=2*jkyij*log(yijπ^ij*mi),i=1,,n.

Dóndeπij es la probabilidad categórica, acumulativa o condicional, ymi es el tamaño de muestra correspondiente.

Algoritmos

trata s en cualquiera o como valores faltantes, y los ignora.mnrfitNaNXY

Referencias

[1] McCullagh, P., and J. A. Nelder. Generalized Linear Models. New York: Chapman & Hall, 1990.

[2] Long, J. S. Regression Models for Categorical and Limited Dependent Variables. Sage Publications, 1997.

[3] Dobson, A. J., and A. G. Barnett. An Introduction to Generalized Linear Models. Chapman and Hall/CRC. Taylor & Francis Group, 2008.

Introducido en R2006b