Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

mnrfit

Regresión logística multinomial

Descripción

ejemplo

B = mnrfit(X,Y) devuelve una matriz, , de estimaciones de coeficiente para una regresión logística multinomial de las respuestas nominales en los predictores en .BYX

ejemplo

B = mnrfit(X,Y,Name,Value) devuelve una matriz, , de estimaciones de coeficiente para un ajuste de modelo multinomial con opciones adicionales especificadas por uno o más argumentos de par.BName,Value

Por ejemplo, puede ajustar un modelo nominal, un ordinal o jerárquico, o cambiar la función de vínculo.

ejemplo

[B,dev,stats] = mnrfit(___) también devuelve la desviación del ajuste, , y la estructura de cualquiera de los argumentos de entrada anteriores. contiene estadísticas del modelo, como grados de libertad, errores estándar para estimaciones de coeficientes y residuos.devstatsstats

Ejemplos

contraer todo

Ajuste una regresión multinomial para los resultados nominales e interprete los resultados.

Cargue los datos de ejemplo.

load fisheriris

El vector de columna, , consiste en flores de iris de tres especies diferentes, setosa, versicolor, virginica.species La matriz doble consta de cuatro tipos de medidas en las flores, la longitud y anchura de los sépalos y pétalos en centímetros, respectivamente.meas

Defina la variable de respuesta nominal mediante una matriz categórica.

sp = categorical(species);

Ajuste un modelo de regresión multinomial para predecir la especie utilizando las mediciones.

[B,dev,stats] = mnrfit(meas,sp); B
B = 5×2
103 ×

    2.2103    0.0426
    0.7376    0.0025
   -0.6215    0.0067
   -0.5659   -0.0094
   -3.0210   -0.0183

Este es un modelo nominal para los riesgos relativos de la categoría de respuesta, con pendientes separadas en los cuatro predictores, es decir, cada categoría de .meas La primera fila de contiene los términos de interceptación para el riesgo relativo de las dos primeras categorías de respuesta, setosa y versicolor frente a la categoría de referencia, virginica.B Las últimas cuatro filas contienen los taludes para los modelos para las dos primeras categorías. acepta la tercera categoría como categoría de referencia.mnrfit

El riesgo relativo de que una flor de iris sea la especie 2 (versicolor) frente a la especie 3 (virginica) es la proporción de las dos probabilidades (la probabilidad de ser la especie 2 y la probabilidad de ser la especie 3). El modelo para el riesgo relativo es

<math display="block">
<mrow>
<mi mathvariant="normal">ln</mi>
<mrow>
<mo>(</mo>
<mrow>
<mfrac>
<mrow>
<mrow>
<mrow>
<msub>
<mrow>
<mi>π</mi>
</mrow>
<mrow>
<mstyle mathvariant="normal">
<mrow>
<mrow>
<mi>v</mi>
<mi>e</mi>
<mi>r</mi>
<mi>s</mi>
<mi>i</mi>
<mi>c</mi>
<mi>o</mi>
<mi>l</mi>
<mi>o</mi>
<mi>r</mi>
</mrow>
</mrow>
</mstyle>
</mrow>
</msub>
</mrow>
</mrow>
</mrow>
<mrow>
<mrow>
<mrow>
<msub>
<mrow>
<mi>π</mi>
</mrow>
<mrow>
<mstyle mathvariant="normal">
<mrow>
<mrow>
<mi>v</mi>
<mi>i</mi>
<mi>r</mi>
<mi>g</mi>
<mi>i</mi>
<mi>n</mi>
<mi>i</mi>
<mi>c</mi>
<mi>a</mi>
</mrow>
</mrow>
</mstyle>
</mrow>
</msub>
</mrow>
</mrow>
</mrow>
</mfrac>
</mrow>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mn>4</mn>
<mn>2</mn>
<mo>.</mo>
<mn>6</mn>
<mo>+</mo>
<mn>2</mn>
<mo>.</mo>
<mn>5</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mn>1</mn>
</mrow>
</msub>
</mrow>
<mo>+</mo>
<mn>6</mn>
<mo>.</mo>
<mn>7</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mn>2</mn>
</mrow>
</msub>
</mrow>
<mo>-</mo>
<mn>9</mn>
<mo>.</mo>
<mn>4</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mn>3</mn>
</mrow>
</msub>
</mrow>
<mo>-</mo>
<mn>1</mn>
<mn>8</mn>
<mo>.</mo>
<mn>3</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mn>4</mn>
</mrow>
</msub>
</mrow>
<mo>.</mo>
</mrow>
</math>

Los coeficientes expresan tanto los efectos de las variables predictoras en el riesgo relativo como las probabilidades de registro de estar en una categoría frente a la categoría de referencia. Por ejemplo, el coeficiente estimado 2.5 indica que el riesgo relativo de ser la especie 2 (versicolor) frente a la especie 3 (virginica) aumenta exp(2.5) veces por cada aumento de unidad en

<math display="block">
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mn>1</mn>
</mrow>
</msub>
</mrow>
</math>
, la primera medida, dado que todo lo demás es igual. Las probabilidades relativas de registro de ser versicolor frente a virginica aumenta 2,5 veces con un aumento de una unidad en
<math display="block">
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mn>1</mn>
</mrow>
</msub>
</mrow>
</math>
, dado que todo lo demás es igual.

Si los coeficientes se converguen hacia el infinito o el infinito negativo, los coeficientes estimados pueden variar ligeramente dependiendo de su sistema operativo.

Compruebe la significancia estadística de los coeficientes del modelo.

stats.p
ans = 5×2

         0    0.0000
         0    0.0281
         0    0.0000
         0    0.0000
         0    0.0000

El pequeño

<math display="block">
<mrow>
<mi>p</mi>
</mrow>
</math>
-los valores indican que todas las medidas son significativas en el riesgo relativo de ser una setosa frente a una virginica (especie 1 en comparación con la especie 3) y ser un versicolor frente a una virginica (especie 2 en comparación con la especie 3).

Solicitar los errores estándar de estimaciones de coeficiente.

stats.se
ans = 5×2

   12.4038    5.2719
    3.5783    1.1228
    3.1760    1.4789
    3.5403    1.2934
    7.1203    2.0967

Calcule los límites de confianza del 95% para los coeficientes.

LL = stats.beta - 1.96.*stats.se; UL = stats.beta + 1.96.*stats.se;

Mostrar los intervalos de confianza para los coeficientes del modelo para el riesgo relativo de ser una setosa frente a una virginica (la primera columna de coeficientes en ).B

[LL(:,1) UL(:,1)]
ans = 5×2
103 ×

    2.1860    2.2346
    0.7306    0.7446
   -0.6277   -0.6153
   -0.5728   -0.5590
   -3.0350   -3.0071

Encuentre los intervalos de confianza para los coeficientes del modelo para el riesgo relativo de ser un versicolor frente a una virginica (la segunda columna de coeficientes en ).B

[LL(:,2) UL(:,2)]
ans = 5×2

   32.3049   52.9707
    0.2645    4.6660
    3.7823    9.5795
  -11.9644   -6.8944
  -22.3957  -14.1766

Ajuste un modelo de regresión multinomial para respuestas categóricas con orden natural entre categorías.

Cargue los datos de ejemplo y defina las variables predictoras.

load carbig X = [Acceleration Displacement Horsepower Weight];

Las variables predictoras son la aceleración, el desplazamiento del motor, la potencia y el peso de los coches. La variable de respuesta es millas por galón (mpg).

Cree una variable de respuesta ordinal categorizando en cuatro niveles de 9 a 48 mpg etiquetando los valores de respuesta en el rango 9-19 como 1, 20-29 como 2, 30-39 como 3 y 40-48 como 4.MPG

miles = ordinal(MPG,{'1','2','3','4'},[],[9,19,29,39,48]);

Ajuste un modelo de respuesta ordinal para la variable de respuesta .miles

[B,dev,stats] = mnrfit(X,miles,'model','ordinal'); B
B = 7×1

  -16.6895
  -11.7208
   -8.0606
    0.1048
    0.0103
    0.0645
    0.0017

Los tres primeros elementos son los términos de interceptación para los modelos, y los últimos cuatro elementos de son los coeficientes de las covariables, asumidos comunes en todas las categorías.BB Este modelo corresponde a , que también se llama el modelo, donde hay una intercepción diferente pero pendientes comunes entre las categorías.regresión paralelacuotas proporcionales Puede especificar esto mediante el argumento de par nombre-valor, que es el valor predeterminado para los modelos ordinales.'interactions','off'

[B(1:3)'; repmat(B(4:end),1,3)]
ans = 5×3

  -16.6895  -11.7208   -8.0606
    0.1048    0.1048    0.1048
    0.0103    0.0103    0.0103
    0.0645    0.0645    0.0645
    0.0017    0.0017    0.0017

La función de vínculo en el modelo es logit ( ), que es el valor predeterminado para un modelo ordinal.'link','logit' Los coeficientes expresan el riesgo relativo o las probabilidades de registro del mpg de un coche siendo menor o igual a un valor frente a ese valor.

El modelo de cuotas proporcionales en este ejemplo es

<math display="block">
<mrow>
<mtable columnalign="left">
<mtr>
<mtd>
<mrow>
<mi mathvariant="normal">ln</mi>
<mrow>
<mo>(</mo>
<mrow>
<mfrac>
<mrow>
<mrow>
<mi>P</mi>
<mrow>
<mo>(</mo>
<mrow>
<mi>m</mi>
<mi>p</mi>
<mi>g</mi>
<mo></mo>
<mn>1</mn>
<mn>9</mn>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
</mrow>
<mrow>
<mrow>
<mi>P</mi>
<mrow>
<mo>(</mo>
<mrow>
<mi>m</mi>
<mi>p</mi>
<mi>g</mi>
<mo>></mo>
<mn>1</mn>
<mn>9</mn>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
</mrow>
</mfrac>
</mrow>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mo>-</mo>
<mn>1</mn>
<mn>6</mn>
<mo>.</mo>
<mn>6</mn>
<mn>8</mn>
<mn>9</mn>
<mn>5</mn>
<mo>+</mo>
<mn>0</mn>
<mo>.</mo>
<mn>1</mn>
<mn>0</mn>
<mn>4</mn>
<mn>8</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>A</mi>
</mrow>
</msub>
</mrow>
<mo>+</mo>
<mn>0</mn>
<mo>.</mo>
<mn>0</mn>
<mn>1</mn>
<mn>0</mn>
<mn>3</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>D</mi>
</mrow>
</msub>
</mrow>
<mo>+</mo>
<mn>0</mn>
<mo>.</mo>
<mn>0</mn>
<mn>6</mn>
<mn>4</mn>
<mn>5</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>H</mi>
</mrow>
</msub>
</mrow>
<mo>+</mo>
<mn>0</mn>
<mo>.</mo>
<mn>0</mn>
<mn>0</mn>
<mn>1</mn>
<mn>7</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>W</mi>
</mrow>
</msub>
</mrow>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow></mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mi mathvariant="normal">ln</mi>
<mrow>
<mo>(</mo>
<mrow>
<mfrac>
<mrow>
<mrow>
<mi>P</mi>
<mrow>
<mo>(</mo>
<mrow>
<mi>m</mi>
<mi>p</mi>
<mi>g</mi>
<mo></mo>
<mn>2</mn>
<mn>9</mn>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
</mrow>
<mrow>
<mrow>
<mi>P</mi>
<mrow>
<mo>(</mo>
<mrow>
<mi>m</mi>
<mi>p</mi>
<mi>g</mi>
<mo>></mo>
<mn>2</mn>
<mn>9</mn>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
</mrow>
</mfrac>
</mrow>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mo>-</mo>
<mn>1</mn>
<mn>1</mn>
<mo>.</mo>
<mn>7</mn>
<mn>2</mn>
<mn>0</mn>
<mn>8</mn>
<mo>+</mo>
<mn>0</mn>
<mo>.</mo>
<mn>1</mn>
<mn>0</mn>
<mn>4</mn>
<mn>8</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>A</mi>
</mrow>
</msub>
</mrow>
<mo>+</mo>
<mn>0</mn>
<mo>.</mo>
<mn>0</mn>
<mn>1</mn>
<mn>0</mn>
<mn>3</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>D</mi>
</mrow>
</msub>
</mrow>
<mo>+</mo>
<mn>0</mn>
<mo>.</mo>
<mn>0</mn>
<mn>6</mn>
<mn>4</mn>
<mn>5</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>H</mi>
</mrow>
</msub>
</mrow>
<mo>+</mo>
<mn>0</mn>
<mo>.</mo>
<mn>0</mn>
<mn>0</mn>
<mn>1</mn>
<mn>7</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>W</mi>
</mrow>
</msub>
</mrow>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow></mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mi mathvariant="normal">ln</mi>
<mrow>
<mo>(</mo>
<mrow>
<mfrac>
<mrow>
<mrow>
<mi>P</mi>
<mrow>
<mo>(</mo>
<mrow>
<mi>m</mi>
<mi>p</mi>
<mi>g</mi>
<mo></mo>
<mn>3</mn>
<mn>9</mn>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
</mrow>
<mrow>
<mrow>
<mi>P</mi>
<mrow>
<mo>(</mo>
<mrow>
<mi>m</mi>
<mi>p</mi>
<mi>g</mi>
<mo>></mo>
<mn>3</mn>
<mn>9</mn>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
</mrow>
</mfrac>
</mrow>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mo>-</mo>
<mn>8</mn>
<mo>.</mo>
<mn>0</mn>
<mn>6</mn>
<mn>0</mn>
<mn>6</mn>
<mo>+</mo>
<mn>0</mn>
<mo>.</mo>
<mn>1</mn>
<mn>0</mn>
<mn>4</mn>
<mn>8</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>A</mi>
</mrow>
</msub>
</mrow>
<mo>+</mo>
<mn>0</mn>
<mo>.</mo>
<mn>0</mn>
<mn>1</mn>
<mn>0</mn>
<mn>3</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>D</mi>
</mrow>
</msub>
</mrow>
<mo>+</mo>
<mn>0</mn>
<mo>.</mo>
<mn>0</mn>
<mn>6</mn>
<mn>4</mn>
<mn>5</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>H</mi>
</mrow>
</msub>
</mrow>
<mo>+</mo>
<mn>0</mn>
<mo>.</mo>
<mn>0</mn>
<mn>0</mn>
<mn>1</mn>
<mn>7</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>W</mi>
</mrow>
</msub>
</mrow>
</mrow>
</mtd>
</mtr>
</mtable>
</mrow>
</math>

Por ejemplo, la estimación del coeficiente de 0.1048 indica que un cambio de unidad en la aceleración afectaría las probabilidades de que el mpg de un coche sea menor o igual a 19 frente a 19, o que sea menor o igual a 29 frente a 29 , o ser menor o igual a 39 frente a 39, por un factor de exp(0.01048) dado que todo lo demás es igual.

Evaluar la importancia de los coeficientes.

stats.p
ans = 7×1

    0.0000
    0.0000
    0.0000
    0.1899
    0.0350
    0.0000
    0.0118

el

<math display="block">
<mrow>
<mi>p</mi>
</mrow>
</math>
-valores de 0.035, 0.0000 y 0.0118 para el desplazamiento del motor, la potencia y el peso de un coche, respectivamente, indican que estos factores son significativos en las probabilidades de que el mpg de un coche sea menor o igual a un cierto valor en comparación con ser mayor que ese valor.

Ajuste un modelo jerárquico de regresión multinomial.

Cargue los datos de ejemplo.

load(fullfile(matlabroot,'examples','stats','smoking.mat'));

El conjunto de datos contiene cinco variables: sexo, edad, peso y presión arterial sistólica y diastólica.smoking El sexo es una variable binaria donde 1 indica pacientes femeninos, y 0 indica pacientes masculinos.

Defina la variable de respuesta.

Y = categorical(smoking.Smoker);

Los datos tienen cuatro categorías:Smoker

  • 0: No fumador, 0 cigarrillos al día

  • 1: Fumador, 1–5 cigarrillos al día

  • 2: Fumador, 6-10 cigarrillos al día

  • 3: Fumador, 11 o más cigarrillos al día

Defina las variables predictoras.

X = [smoking.Sex smoking.Age smoking.Weight...     smoking.SystolicBP smoking.DiastolicBP];

Ajuste un modelo multinomial jerárquico.

[B,dev,stats] = mnrfit(X,Y,'model','hierarchical'); B
B = 6×3

   43.8148    5.9571   44.0712
    1.8709   -0.0230    0.0662
    0.0188    0.0625    0.1335
    0.0046   -0.0072   -0.0130
   -0.2170    0.0416   -0.0324
   -0.2273   -0.1449   -0.4824

La primera columna de incluye la interceptación y las estimaciones de coeficiente para el modelo del riesgo relativo de ser un no fumador frente a un fumador.B La segunda columna incluye las estimaciones de parámetros para modelar las probabilidades de registro de fumar 1–5 cigarrillos al día en comparación con más de cinco cigarrillos al día dado que una persona es fumadora. Por último, la tercera columna incluye las estimaciones de parámetros para modelar las probabilidades de registro de una persona fumando 6-10 cigarrillos al día frente a más de 10 cigarrillos al día dado que fuma más de 5 cigarrillos al día.

Los coeficientes difieren entre categorías. Puede especificar esto mediante el argumento de par nombre-valor, que es el valor predeterminado para los modelos jerárquicos.'interactions','on' Por lo tanto, el modelo en este ejemplo es

<math display="block">
<mrow>
<mi mathvariant="normal">ln</mi>
<mrow>
<mo>(</mo>
<mrow>
<mfrac>
<mrow>
<mrow>
<mi>P</mi>
<mrow>
<mo>(</mo>
<mrow>
<mi>y</mi>
<mo>=</mo>
<mn>0</mn>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
</mrow>
<mrow>
<mrow>
<mi>P</mi>
<mrow>
<mo>(</mo>
<mrow>
<mi>y</mi>
<mo>></mo>
<mn>0</mn>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
</mrow>
</mfrac>
</mrow>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mn>4</mn>
<mn>3</mn>
<mo>.</mo>
<mn>8</mn>
<mn>1</mn>
<mn>4</mn>
<mn>8</mn>
<mo>+</mo>
<mn>1</mn>
<mo>.</mo>
<mn>8</mn>
<mn>7</mn>
<mn>0</mn>
<mn>9</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>S</mi>
</mrow>
</msub>
</mrow>
<mo>+</mo>
<mn>0</mn>
<mo>.</mo>
<mn>0</mn>
<mn>1</mn>
<mn>8</mn>
<mn>8</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>A</mi>
</mrow>
</msub>
</mrow>
<mo>+</mo>
<mn>0</mn>
<mo>.</mo>
<mn>0</mn>
<mn>0</mn>
<mn>4</mn>
<mn>6</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>W</mi>
</mrow>
</msub>
</mrow>
<mo>-</mo>
<mn>0</mn>
<mo>.</mo>
<mn>2</mn>
<mn>1</mn>
<mn>7</mn>
<mn>0</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>S</mi>
<mi>B</mi>
<mi>P</mi>
</mrow>
</msub>
</mrow>
<mo>-</mo>
<mn>0</mn>
<mo>.</mo>
<mn>2</mn>
<mn>2</mn>
<mn>7</mn>
<mn>3</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>D</mi>
<mi>B</mi>
<mi>P</mi>
</mrow>
</msub>
</mrow>
</mrow>
</math>

<math display="block">
<mrow>
<mi mathvariant="normal">ln</mi>
<mrow>
<mo>(</mo>
<mrow>
<mfrac>
<mrow>
<mrow>
<mi>P</mi>
<mrow>
<mo>(</mo>
<mrow>
<mn>1</mn>
<mo></mo>
<mi>y</mi>
<mo></mo>
<mn>5</mn>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
</mrow>
<mrow>
<mrow>
<mi>P</mi>
<mrow>
<mo>(</mo>
<mrow>
<mi>y</mi>
<mo>></mo>
<mn>5</mn>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
</mrow>
</mfrac>
</mrow>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mn>5</mn>
<mo>.</mo>
<mn>9</mn>
<mn>5</mn>
<mn>7</mn>
<mn>1</mn>
<mo>-</mo>
<mn>0</mn>
<mo>.</mo>
<mn>0</mn>
<mn>2</mn>
<mn>3</mn>
<mn>0</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>S</mi>
</mrow>
</msub>
</mrow>
<mo>+</mo>
<mn>0</mn>
<mo>.</mo>
<mn>0</mn>
<mn>6</mn>
<mn>2</mn>
<mn>5</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>A</mi>
</mrow>
</msub>
</mrow>
<mo>-</mo>
<mn>0</mn>
<mo>.</mo>
<mn>0</mn>
<mn>0</mn>
<mn>7</mn>
<mn>2</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>W</mi>
</mrow>
</msub>
</mrow>
<mo>+</mo>
<mn>0</mn>
<mo>.</mo>
<mn>0</mn>
<mn>4</mn>
<mn>1</mn>
<mn>6</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>S</mi>
<mi>B</mi>
<mi>P</mi>
</mrow>
</msub>
</mrow>
<mo>-</mo>
<mn>0</mn>
<mo>.</mo>
<mn>1</mn>
<mn>4</mn>
<mn>4</mn>
<mn>9</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>D</mi>
<mi>B</mi>
<mi>P</mi>
</mrow>
</msub>
</mrow>
</mrow>
</math>

<math display="block">
<mrow>
<mi mathvariant="normal">ln</mi>
<mrow>
<mo>(</mo>
<mrow>
<mfrac>
<mrow>
<mrow>
<mi>P</mi>
<mrow>
<mo>(</mo>
<mrow>
<mn>6</mn>
<mo></mo>
<mi>y</mi>
<mo></mo>
<mn>1</mn>
<mn>0</mn>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
</mrow>
<mrow>
<mrow>
<mi>P</mi>
<mrow>
<mo>(</mo>
<mrow>
<mi>y</mi>
<mo>></mo>
<mn>1</mn>
<mn>0</mn>
</mrow>
<mo>)</mo>
</mrow>
</mrow>
</mrow>
</mfrac>
</mrow>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mn>4</mn>
<mn>4</mn>
<mo>.</mo>
<mn>0</mn>
<mn>7</mn>
<mn>1</mn>
<mn>2</mn>
<mo>+</mo>
<mn>0</mn>
<mo>.</mo>
<mn>0</mn>
<mn>6</mn>
<mn>6</mn>
<mn>2</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>S</mi>
</mrow>
</msub>
</mrow>
<mo>+</mo>
<mn>0</mn>
<mo>.</mo>
<mn>1</mn>
<mn>3</mn>
<mn>3</mn>
<mn>5</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>A</mi>
</mrow>
</msub>
</mrow>
<mo>-</mo>
<mn>0</mn>
<mo>.</mo>
<mn>0</mn>
<mn>1</mn>
<mn>3</mn>
<mn>0</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>W</mi>
</mrow>
</msub>
</mrow>
<mo>-</mo>
<mn>0</mn>
<mo>.</mo>
<mn>0</mn>
<mn>3</mn>
<mn>2</mn>
<mn>4</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>S</mi>
<mi>B</mi>
<mi>P</mi>
</mrow>
</msub>
</mrow>
<mo>-</mo>
<mn>0</mn>
<mo>.</mo>
<mn>4</mn>
<mn>8</mn>
<mn>2</mn>
<mn>4</mn>
<mrow>
<msub>
<mrow>
<mi>X</mi>
</mrow>
<mrow>
<mi>D</mi>
<mi>B</mi>
<mi>P</mi>
</mrow>
</msub>
</mrow>
</mrow>
</math>

Por ejemplo, la estimación del coeficiente de 1.8709 indica que la probabilidad de ser fumador frente a un no fumador aumenta por exp(1.8709) a 6,49 veces a medida que el género cambia de mujer a macho dado todo lo demás constante.

Evaluar la significancia estadística de los términos.

stats.p
ans = 6×3

    0.0000    0.5363    0.2149
    0.3549    0.9912    0.9835
    0.6850    0.2676    0.2313
    0.9032    0.8523    0.8514
    0.0009    0.5187    0.8165
    0.0004    0.0483    0.0545

El sexo, la edad o el peso no parecen significativos en ningún nivel. el

<math display="block">
<mrow>
<mi>p</mi>
</mrow>
</math>
-valores de 0.0009 y 0.0004 indican que ambos tipos de presión arterial son significativos sobre el riesgo relativo de que una persona sea fumadora frente a un no fumador. el
<math display="block">
<mrow>
<mi>p</mi>
</mrow>
</math>
-valor de 0.0483 muestra que sólo la presión arterial diastólica es significativa en las probabilidades de que una persona fume 0-5 cigarrillos al día frente a más de 5 cigarrillos al día. Del mismo modo, el
<math display="block">
<mrow>
<mi>p</mi>
</mrow>
</math>
-valor de 0.0545 indica que la presión arterial diastólica es significativa en las probabilidades de que una persona fume 6-10 cigarrillos al día frente a más de 10 cigarrillos al día.

Compruebe si hay algún factor no significativo correlacionados entre sí. Dibuja una gráfica de dispersión de edad frente al peso agrupada por sexo.

figure() gscatter(smoking.Age,smoking.Weight,smoking.Sex) legend('Male','Female') xlabel('Age') ylabel('Weight')

El rango de peso de un individuo parece diferir según el género. La edad no parece tener ninguna correlación obvia con el sexo o el peso. La edad es insignificante y el peso parece estar correlacionado con el sexo, por lo que puede eliminar ambos y reconstruir el modelo.

Elimine la edad y el peso del modelo y ajuste un modelo jerárquico con el sexo, la presión arterial sistólica y la presión arterial diastólica como las variables predictoras.

X = double([smoking.Sex smoking.SystolicBP... smoking.DiastolicBP]); [B,dev,stats] = mnrfit(X,Y,'model','hierarchical'); B
B = 4×3

   44.8456    5.3230   25.0248
    1.6045    0.2330    0.4982
   -0.2161    0.0497    0.0179
   -0.2222   -0.1358   -0.3092

En este caso, una estimación del coeficiente de 1.6045 indica que la probabilidad de ser un no fumador frente a un fumador aumenta por exp(1.6045) a 4,97 veces a medida que el sexo cambia de hombre a mujer. Un aumento unitario de la presión arterial sistólica indica una disminución de exp(–.2161) a 0,8056 en la probabilidad de ser un no fumador frente a un fumador. Del mismo modo, un aumento unitario de la presión arterial diastólica indica una disminución exp(–.2222) a 0,8007 en la tasa relativa de ser no fumador frente a ser fumador.

Evaluar la significancia estadística de los términos.

stats.p
ans = 4×3

    0.0000    0.4715    0.2325
    0.0210    0.7488    0.6362
    0.0010    0.4107    0.8899
    0.0003    0.0483    0.0718

el

<math display="block">
<mrow>
<mi>p</mi>
</mrow>
</math>
-valores de 0.0210, 0.0010 y 0.0003 indican que los términos sexo y ambos tipos de presión arterial son significativos en el riesgo relativo de que una persona sea un no fumador frente a un fumador, dados los otros términos en el modelo. Sobre la base de la
<math display="block">
<mrow>
<mi>p</mi>
</mrow>
</math>
-valor de 0,0483, la presión arterial diastólica parece significativa en el riesgo relativo de que una persona fume 1-5 cigarrillos frente a más de 5 cigarrillos al día, dado que esta persona es fumadora. Debido a que ninguno de los
<math display="block">
<mrow>
<mi>p</mi>
</mrow>
</math>
-los valores de la tercera columna son inferiores a 0,05, se puede decir que ninguna de las variables son estadísticamente significativas en el riesgo relativo de que una persona fume de 6 a 10 cigarrillos frente a más de 10 cigarrillos, dado que esta persona fuma más de 5 cigarrillos al día.

Argumentos de entrada

contraer todo

Observaciones sobre variables predictoras, especificadas como una matriz -by-. contiene observaciones para los predictores.npXnp

Nota

incluye automáticamente un término constante (intercepción) en todos los modelos.mnrfit No incluya una columna de 1s en .X

Tipos de datos: single | double

Valores de respuesta, especificados como un vector de columna o una matriz. puede ser uno de los siguientes:Y

  • Una matriz -por-, donde ( , ) es el número de resultados de la categoría multinomial para las combinaciones predictoras dadas por ( ,:).nk Yijj Xi En este caso, el número de observaciones se realiza en cada combinación predictora.

  • Un vector de columna -by-1 de enteros escalares de 1 a la indicación del valor de la respuesta para cada observación.nk En este caso, todos los tamaños de muestra son 1.

  • Matriz categórica -by-1 que indica el valor nominal u ordinal de la respuesta para cada observación.n En este caso, todos los tamaños de muestra son 1.

Argumentos de par nombre-valor

Especifique pares opcionales separados por comas de argumentos. es el nombre del argumento y es el valor correspondiente. deben aparecer entre comillas.Name,ValueNameValueName Puede especificar varios argumentos de par de nombre y valor en cualquier orden como .Name1,Value1,...,NameN,ValueN

Ejemplo: especifica un modelo ordinal con una función de enlace probit.'Model','ordinal','Link','probit'

Tipo de modelo que se ajuste, especificado como el par separado por comas que consta de y uno de los siguientes.'Model'

'nominal'Predeterminado. No hay ningún orden entre las categorías de respuesta.
'ordinal'Hay un orden natural entre las categorías de respuesta.
'hierarchical'La elección de la categoría de respuesta es secuencial/anidada.

Ejemplo: 'Model','ordinal'

Indicador de interacción entre las categorías y coeficientes multinomiales, especificado como el par separado por comas que consta de y uno de los siguientes.'Interactions'

'on'Predeterminado para modelos nominales y jerárquicos. Ajuste un modelo con diferentes coeficientes entre categorías.
'off'Predeterminado para los modelos ordinales. Ajuste un modelo con un conjunto común de coeficientes para las variables predictoras, en todas las categorías multinomiales. Esto se describe a menudo como o el archivo .regresión paralelamodelo de cuotas proporcionales

En todos los casos, el modelo tiene diferentes interceptaciones entre categorías. La elección de determina las dimensiones de la matriz de salida.'Interactions'B

Ejemplo: 'Interactions','off'

Indicador para estimar un parámetro de dispersión, especificado como el par separado por comas que consta de y uno de los siguientes.'EstDisp'

'off'Predeterminado. Utilice el valor de dispersión teórico de 1.
'on'Calcule un parámetro de dispersión para la distribución multinomial en errores estándar informáticos.

Ejemplo: 'EstDisp','on'

Argumentos de salida

contraer todo

Estimaciones de coeficiente para una regresión logística multinomial de las respuestas en , devueltas como un vector o una matriz.Y

  • Si es , entonces es un – 1 + vector.'Interaction''off'Bkp La primera – 1 filas de corresponden a los términos de interceptación, una para cada una – 1 categorías multinomiales, y las filas restantes corresponden a los coeficientes predictores, que son comunes para todas las primeras – 1 categorías.kBkpk

  • Si es , entonces es una matriz ( + 1)-by-( – 1).'Interaction''on'Bpk Cada columna de corresponde al término de interceptación estimado y a los coeficientes predictores, uno para cada una de las primeras categorías multinomiales.Bk

Las estimaciones de la categoría de la siguiente se consideran cero, ya que toma la última categoría como categoría de referencia.kmnrfit

Desviación del ajuste, devuelto como un valor escalar. Es el doble de la diferencia entre la máxima probabilidad de registro alcanzable y la alcanzada bajo el modelo ajustado. Esto corresponde a la suma de los residuos de desviación,

dev=2*injkyij*log(yijπ^ij*mi)=inrdi,

Dónderdi son los residuos de desviación. Para los residuos de desviación, véase .stats

Estadísticas del modelo, devueltas como una estructura que contiene los siguientes campos.

betaLas estimaciones del coeficiente. Estos son los mismos que .B
dfe

Grados de libertad por error

  • Si es , entonces los grados de libertad es *( – 1) – ( – 1 + ).'Interactions''off'nkkp

  • Si es , entonces los grados de libertad es ( – + 1)*( – 1).'Interactions''on'npk

sfitParámetro de dispersión estimado.
s

Parámetro de dispersión teórico o estimado.

  • Si es , entonces es el parámetro de dispersión teórica, 1.'Estdisp''off's

  • Si es , entonces es igual al parámetro de dispersión estimado, .'Estdisp''on'ssfit

estdispIndicador de un parámetro de dispersión teórico o estimado.
seErrores estándar de estimaciones de coeficientes, .B
coeffcorrMatriz de correlación estimada para .B
covbMatriz de covarianza estimada para .B
testadísticas de .tB
p-valores para .pB
resid

Residuos crudos. Se observan menos valores ajustados,

rij=yijπ^ij*mi,{i=1,,nj=1,,k,

Dóndeπij es la probabilidad categórica, acumulativa o condicional, ymi es el tamaño de muestra correspondiente.

residp

Residuos de Pearson, que son los residuos brutos escalados por la desviación estándar estimada:

rpij=rijσ^ij=yijπ^ij*miπ^ij*(1π^ij)*mi,{i=1,,nj=1,,k,

Dóndeπij es la probabilidad categórica, acumulativa o condicional, ymi es el tamaño de muestra correspondiente.

residd

Residuos de desviación:

rdi=2*jkyij*log(yijπ^ij*mi),i=1,,n.

Dóndeπij es la probabilidad categórica, acumulativa o condicional, ymi es el tamaño de muestra correspondiente.

Algoritmos

trata s en uno o como valores que faltan, y los ignora.mnrfitNaNXY

Referencias

[1] McCullagh, P., and J. A. Nelder. Generalized Linear Models. New York: Chapman & Hall, 1990.

[2] Long, J. S. Regression Models for Categorical and Limited Dependent Variables. Sage Publications, 1997.

[3] Dobson, A. J., and A. G. Barnett. An Introduction to Generalized Linear Models. Chapman and Hall/CRC. Taylor & Francis Group, 2008.

Introducido en R2006b