Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

Interpretar los resultados de regresión lineal

Este ejemplo muestra cómo visualizar e interpretar las estadísticas de salida de regresión lineal.

Ajustar modelo de regresión lineal

Cargue el conjunto de datos, un conjunto de datos de entrada de matriz.carsmall

load carsmall X = [Weight,Horsepower,Acceleration];

Ajuste un modelo de regresión lineal utilizando.fitlm

lm = fitlm(X,MPG)
lm =  Linear regression model:     y ~ 1 + x1 + x2 + x3  Estimated Coefficients:                     Estimate        SE          tStat        pValue                      __________    _________    _________    __________      (Intercept)        47.977       3.8785        12.37    4.8957e-21     x1             -0.0065416    0.0011274      -5.8023    9.8742e-08     x2              -0.042943     0.024313      -1.7663       0.08078     x3              -0.011583      0.19333    -0.059913       0.95236   Number of observations: 93, Error degrees of freedom: 89 Root Mean Squared Error: 4.09 R-squared: 0.752,  Adjusted R-Squared: 0.744 F-statistic vs. constant model: 90, p-value = 7.38e-27 

La visualización del modelo incluye la fórmula del modelo, los coeficientes estimados y las estadísticas de resumen del modelo.

La fórmula del modelo en la pantalla, corresponde ay ~ 1 + x1 + x2 + x3

<math display="inline">
<mrow>
<mi mathvariant="italic">y</mi>
<mo>=</mo>
<msub>
<mrow>
<mi>β</mi>
</mrow>
<mrow>
<mn>0</mn>
</mrow>
</msub>
<mo>+</mo>
<msub>
<mrow>
<mi>β</mi>
</mrow>
<mrow>
<mn>1</mn>
</mrow>
</msub>
<msub>
<mrow>
<mi mathvariant="italic">X</mi>
</mrow>
<mrow>
<mn>1</mn>
</mrow>
</msub>
<mo>+</mo>
<msub>
<mrow>
<mi>β</mi>
</mrow>
<mrow>
<mn>2</mn>
</mrow>
</msub>
<msub>
<mrow>
<mi mathvariant="italic">X</mi>
</mrow>
<mrow>
<mn>2</mn>
</mrow>
</msub>
<mo>+</mo>
<msub>
<mrow>
<mi>β</mi>
</mrow>
<mrow>
<mn>3</mn>
</mrow>
</msub>
<msub>
<mrow>
<mi mathvariant="italic">X</mi>
</mrow>
<mrow>
<mn>3</mn>
</mrow>
</msub>
<mo>+</mo>
<mi>ϵ</mi>
</mrow>
</math>
.

La visualización del modelo muestra la información del coeficiente estimado, que se almacena en la propiedad.Coefficients Mostrar la propiedad.Coefficients

lm.Coefficients
ans=4×4 table
                    Estimate        SE          tStat        pValue  
                   __________    _________    _________    __________

    (Intercept)        47.977       3.8785        12.37    4.8957e-21
    x1             -0.0065416    0.0011274      -5.8023    9.8742e-08
    x2              -0.042943     0.024313      -1.7663       0.08078
    x3              -0.011583      0.19333    -0.059913       0.95236

La propiedad incluye estas columnas:Coefficient

  • — Estimaciones de coeficiente para cada término correspondiente en el modelo.Estimate Por ejemplo, la estimación para el término constante () es 47,977.intercept

  • — Error estándar de los coeficientes.SE

  • —-estadística para cada coeficiente para probar la hipótesis nula de que el coeficiente correspondiente es cero frente a la alternativa de que es diferente de cero, dados los otros predictores en el modelo.tStatt Tenga en cuenta que.tStat = Estimate/SE Por ejemplo, la-estadística para la intercepción es 47.977/3.8785 = 12,37.t

  • —-valor de la estadística de la prueba de hipótesis de que el coeficiente correspondiente es igual a cero o no.pValuept Por ejemplo, el-valor de la-estadística para es mayor que 0,05, por lo que este término no es significativo en el nivel de significancia 5% dado los otros términos en el modelo.ptx2

Las estadísticas de resumen del modelo son:

  • — Número de filas sin valores.Number of observationsNaN Por ejemplo, es 93 porque el vector de datos tiene seis valores y el vector de datos tiene un valor para una observación diferente, donde el número de filas en y es 100.Number of observationsMPGNaNHorsepowerNaNXMPG

  • — –, donde está el número de observaciones, y es el número de coeficientes en el modelo, incluyendo la intercepción.Error degrees of freedomn pnp Por ejemplo, el modelo tiene cuatro predictores, por lo que el is 93 – 4 = 89.Error degrees of freedom

  • — Raíz cuadrada del error medio cuadrado, que estima la desviación estándar de la distribución de errores.Root mean squared error

  • y — coeficiente de determinación y coeficiente de determinación ajustado, respectivamente.R-squaredAdjusted R-squared Por ejemplo, el valor sugiere que el modelo explica aproximadamente el 75% de la variabilidad en la variable de respuesta.R-squaredMPG

  • — Estadística de prueba para la prueba en el modelo de regresión, que comprueba si el modelo se ajusta significativamente mejor que un modelo degenerado que consta de un término constante.F-statistic vs. constant modelF

  • —-valor para la prueba en el modelo.p-valuepF Por ejemplo, el modelo es significativo con un valor de 7.3816 e-27.p

Anova

Realice el análisis de varianza (ANOVA) para el modelo.

anova(lm,'summary')
ans=3×5 table
                SumSq     DF    MeanSq      F         pValue  
                ______    __    ______    ______    __________

    Total       6004.8    92    65.269                        
    Model         4516     3    1505.3    89.987    7.3816e-27
    Residual    1488.8    89    16.728                        

Esta pantalla muestra lo siguiente.anova

  • — Suma de los cuadrados para el modelo de regresión, el término de error y el total,.SumSqModelResidualTotal

  • — Grados de libertad para cada término.DF Grados de libertad es

    <math display="block">
    <mrow>
    <mi>n</mi>
    <mo>-</mo>
    <mn>1</mn>
    </mrow>
    </math>
    para el total,
    <math display="block">
    <mrow>
    <mi>p</mi>
    <mo>-</mo>
    <mn>1</mn>
    </mrow>
    </math>
    para el modelo y
    <math display="block">
    <mrow>
    <mi>n</mi>
    <mo>-</mo>
    <mi>p</mi>
    </mrow>
    </math>
    para el término de error, donde
    <math display="block">
    <mrow>
    <mi>n</mi>
    </mrow>
    </math>
    es el número de observaciones, y
    <math display="block">
    <mrow>
    <mi>p</mi>
    </mrow>
    </math>
    es el número de coeficientes del modelo, incluida la intercepción. Por ejemplo, el vector de datos tiene seis valores y uno de los vectores de datos, tiene un valor para una observación diferente, por lo que el total de grados de libertad es 93 – 1 = 92.MPGNaNHorsepowerNaN Hay cuatro coeficientes en el modelo, por lo que el modelo es 4 – 1 = 3, y el término para error es 93 – 4 = 89.DFDF

  • — Error cuadrado medio para cada término.MeanSq Tenga en cuenta que.MeanSq = SumSq/DF Por ejemplo, el error medio cuadrado para el término de error es 1488.8/89 = 16,728. La raíz cuadrada de este valor es la en la visualización de la regresión lineal, o 4,09.root mean squared error

  • —-valor estadístico, que es el mismo que en la visualización de la regresión lineal.FFF-statistic vs. constant model En este ejemplo, es 89,987, y en la regresión lineal Mostrar este valor estadístico se redondea hasta 90.F

  • —-valor para la prueba en el modelo.pValuepF En este ejemplo, es 7.3816 e-27.

Si hay términos de orden superior en el modelo de regresión, particiona el modelo en la parte explicada por los términos de orden superior y el resto.anovaSumSq Las estadísticas correspondientes son para probar la importancia de los términos lineales y los términos de orden superior como grupos separados.F

Si los datos incluyen réplicas o varias mediciones con los mismos valores predictores, las particiones del error en la pieza para las réplicas y el resto.anovaSumSq La estadística correspondiente es para probar la falta de ajuste comparando los residuales del modelo con la estimación de desviación sin modelo calculada en las réplicas.F

Descomponga la tabla ANOVA para los términos del modelo.

anova(lm)
ans=4×5 table
              SumSq      DF     MeanSq         F          pValue  
             ________    __    ________    _________    __________

    x1         563.18     1      563.18       33.667    9.8742e-08
    x2         52.187     1      52.187       3.1197       0.08078
    x3       0.060046     1    0.060046    0.0035895       0.95236
    Error      1488.8    89      16.728                           

Esta pantalla muestra lo siguiente:anova

  • Primera columna: términos incluidos en el modelo.

  • — Suma de error cuadrado para cada término excepto para la constante.SumSq

  • — Grados de libertad.DF En este ejemplo, es 1 para cada término del modelo yDF

    <math display="block">
    <mrow>
    <mi>n</mi>
    <mo>-</mo>
    <mi>p</mi>
    </mrow>
    </math>
    para el término de error, donde
    <math display="block">
    <mrow>
    <mi>n</mi>
    </mrow>
    </math>
    es el número de observaciones, y
    <math display="block">
    <mrow>
    <mi>p</mi>
    </mrow>
    </math>
    es el número de coeficientes del modelo, incluida la intercepción. Por ejemplo, para el término de error en este modelo es 93 – 4 = 89.DF Si cualquiera de las variables en el modelo es una variable categórica, la para esa variable es el número de variables indicadoras creadas para sus categorías (número de categorías – 1).DF

  • — Error cuadrado medio para cada término.MeanSq Tenga en cuenta que.MeanSq = SumSq/DF Por ejemplo, el error medio cuadrado para el término de error es 1488.8/89 = 16,728.

  • —-valores para cada coeficiente.FF El-valor es la relación de la media cuadrada de cada término y el error cuadrado medio, es decir,.FF = MeanSq(xi)/MeanSq(Error) Cada-estadística tiene una distribución, con los grados de libertad del numerador, el valor para el término correspondiente y los grados de libertad del denominador,FFDF

    <math display="block">
    <mrow>
    <mi>n</mi>
    <mo>-</mo>
    <mi>p</mi>
    </mrow>
    </math>
    .
    <math display="block">
    <mrow>
    <mi>n</mi>
    </mrow>
    </math>
    es el número de observaciones, y
    <math display="block">
    <mrow>
    <mi>p</mi>
    </mrow>
    </math>
    es el número de coeficientes del modelo. En este ejemplo, cada-estadística tiene unF
    <math display="block">
    <mrow>
    <msub>
    <mrow>
    <mi>F</mi>
    </mrow>
    <mrow>
    <mo stretchy="false">(</mo>
    <mn>1</mn>
    <mo>,</mo>
    <mn>8</mn>
    <mn>9</mn>
    <mo stretchy="false">)</mo>
    </mrow>
    </msub>
    </mrow>
    </math>
    Distribución.

  • —-valor para cada prueba de hipótesis sobre el coeficiente del término correspondiente en el modelo lineal.pValuep Por ejemplo, el-valor para el coeficiente-estadístico de es 0,08078, y no es significativo en el nivel de significancia del 5% dado los otros términos en el modelo.pFx2

Intervalos de confianza de coeficiente

Visualice los intervalos de confianza del coeficiente.

coefCI(lm)
ans = 4×2

   40.2702   55.6833
   -0.0088   -0.0043
   -0.0913    0.0054
   -0.3957    0.3726

Los valores de cada fila son los límites de confianza inferior y superior, respectivamente, para los intervalos de confianza predeterminados de 95% para los coeficientes. Por ejemplo, la primera fila muestra los límites inferior y superior, 40,2702 y 55,6833, para la intercepción,

<math display="block">
<mrow>
<msub>
<mrow>
<mi>β</mi>
</mrow>
<mrow>
<mn>0</mn>
</mrow>
</msub>
</mrow>
</math>
. Del mismo modo, la segunda fila muestra los límites para
<math display="block">
<mrow>
<msub>
<mrow>
<mi>β</mi>
</mrow>
<mrow>
<mn>1</mn>
</mrow>
</msub>
</mrow>
</math>
y así sucesivamente. Los intervalos de confianza proporcionan una medida de precisión para las estimaciones del coeficiente de regresión lineal. Un
<math display="block">
<mrow>
<mn>1</mn>
<mn>0</mn>
<mn>0</mn>
<mo stretchy="false">(</mo>
<mn>1</mn>
<mo>-</mo>
<mi>α</mi>
<mo stretchy="false">)</mo>
<mo stretchy="false">%</mo>
</mrow>
</math>
intervalo de confianza da al rango el coeficiente de regresión correspondiente estará en con
<math display="block">
<mrow>
<mn>1</mn>
<mn>0</mn>
<mn>0</mn>
<mo stretchy="false">(</mo>
<mn>1</mn>
<mo>-</mo>
<mi>α</mi>
<mo stretchy="false">)</mo>
<mo stretchy="false">%</mo>
</mrow>
</math>
Confianza.

También puede cambiar el nivel de confianza. Encuentre los intervalos de confianza del 99% para los coeficientes.

coefCI(lm,0.01)
ans = 4×2

   37.7677   58.1858
   -0.0095   -0.0036
   -0.1069    0.0211
   -0.5205    0.4973

Prueba de hipótesis sobre coeficientes

Pruebe la hipótesis nula de que todos los coeficientes de la variable predictora son iguales a cero frente a la hipótesis alternativa de que al menos uno de ellos es diferente de cero.

[p,F,d] = coefTest(lm)
p = 7.3816e-27 
F = 89.9874 
d = 3 

Aquí, realiza una prueba para la hipótesis de que todos los coeficientes de regresión (excepto para la intercepción) son cero versus al menos uno difiere de cero, que esencialmente es la hipótesis en el modelo.coefTestF Devuelve

<math display="block">
<mrow>
<mi>p</mi>
</mrow>
</math>
, el-valor,, la-estadística, y, los grados de libertad del numerador.pFFd El-estadístico y-valor son los mismos que los de la visualización de la regresión lineal y para el modelo.Fpanova Los grados de libertad es 4 – 1 = 3 porque hay cuatro predictores (incluyendo la intercepción) en el modelo.

Ahora, realice una prueba de hipótesis sobre los coeficientes de la primera y segunda variables predictoras.

H = [0 1 0 0; 0 0 1 0]; [p,F,d] = coefTest(lm,H)
p = 5.1702e-23 
F = 96.4873 
d = 2 

El numerador grados de libertad es el número de coeficientes probados, que es 2 en este ejemplo. Los resultados indican que al menos uno de

<math display="block">
<mrow>
<msub>
<mrow>
<mi>β</mi>
</mrow>
<mrow>
<mn>2</mn>
</mrow>
</msub>
</mrow>
</math>
Y
<math display="block">
<mrow>
<msub>
<mrow>
<mi>β</mi>
</mrow>
<mrow>
<mn>3</mn>
</mrow>
</msub>
</mrow>
</math>
difiere de cero.

Consulte también

| | |

Ejemplos relacionados

Más acerca de