¿Qué es la regresión lineal?
La regresión lineal es una técnica de modelado estadístico que se emplea para describir una variable de respuesta continua como una función de una o varias variables predictoras. Puede ayudar a comprender y predecir el comportamiento de sistemas complejos o a analizar datos experimentales, financieros y biológicos.
Las técnicas de regresión lineal permiten crear un modelo lineal. Este modelo describe la relación entre una variable dependiente \(y\) (también conocida como la respuesta) como una función de una o varias variables independientes \(X_i\) (denominadas predictores). La ecuación general correspondiente a un modelo de regresión lineal es:
\[Y = \beta_0 + \sum \ \beta_k X_k + \epsilon_i\]
donde \(\beta\) representa las estimaciones de parámetros lineales que se deben calcular y \(\epsilon\) representa los términos de error.
Tipos de regresión lineal
Regresión lineal simple: modelos que utilizan un único predictor. La ecuación general es:
\[Y = \beta_0 + \beta_1 X+ \epsilon\]

Ejemplo de regresión lineal simple que muestra cómo predecir el número de accidentes de tráfico mortales en un estado (variable de respuesta, \(Y\)) ) en comparación con la población del estado (variable predictora, \(X\)). (Consulte el ejemplo de código de MATLAB® y cómo usar el operador mldivide para estimar los coeficientes de una regresión lineal simple).
Regresión lineal múltiple: modelos que utilizan múltiples predictores. Esta regresión tiene múltiples \(X_i\) para predecir la respuesta, \(Y\). Este es un ejemplo de la ecuación:
\[Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2+ \epsilon\]

Ejemplo de regresión lineal múltiple, que predice las millas por galón (MPG) de diferentes coches (variable de respuesta, \(Y\)) en función del peso y la potencia (variables predictivas, \(X_j\))). (Consulte el ejemplo de código de MATLAB, y cómo usar la función de regresión y determinar la importancia de la relación de regresión lineal múltiple).
Regresión lineal multivariante: modelos para varias variables de respuesta. Esta regresión tiene múltiples \(Y_i\) que derivan de los mismos datos \(X\). Se expresan con fórmulas diferentes. Este es un ejemplo del sistema con 2 ecuaciones:
\[Y_1 = \beta_{01} + \beta_{11} X_1 + \epsilon_1\]
\[Y_2 = \beta_{02} + \beta_{1 2}X_1 + \epsilon_2\]

Ejemplo de regresión lineal multivariante que muestra cómo predecir las estimaciones de gripe en 9 regiones de EE. UU. (variables de respuesta, \(Y_i\)), basadas en la semana del año (variable predictora, \(X\)). (Consulte el ejemplo de código de MATLAB y cómo utilizar la función mvregress para determinar los coeficientes estimados de una regresión lineal multivariante).
Regresión lineal múltiple multivariante: modelos que utilizan varios predictores para múltiples variables de respuesta. Esta regresión tiene múltiples \(X_i\) para predecir varias respuestas \(Y_i\). Esta es una generalización de las ecuaciones:

Ejemplo de regresión lineal múltiple multivariante que calcula las MPG en ciudad y autopista (como variables de respuesta, \(Y_1\) and \(Y_2\)) a partir de tres variables: distancia entre ejes, peso en vacío y tipo de combustible (variables predictoras, \(X_1\), \(X_2\) and \(X_3\)). (Consulte el ejemplo de código de MATLAB y cómo utilizar la función mvregress para estimar los coeficientes.
Aplicaciones de la regresión lineal
La regresión lineal cuenta con ciertas caracteríticas ideales para las siguientes aplicaciones:
- Predicción o pronóstico: utilice un modelo de regresión para crear un modelo de pronóstico para un conjunto de datos específico. A partir de la moda, puede usar la regresión para predecir valores de respuesta donde solo se conocen los predictores.
- Fuerza de la regresión: utilice un modelo de regresión para determinar si existe una relación entre una variable y un predictor,y cuán estrecha es esta relación.
Regresión lineal con MATLAB
Los ingenieros suelen crear modelos de regresión lineal simple con MATLAB. Para la regresión lineal múltiple y multivariante, puede utilizar Statistics and Machine Learning Toolbox™ desde MATLAB. Permite la regresión por pasos, robusta y multivariante para:
- Generar predicciones
- Comparar ajustes de modelos lineales
- Representar los valores residuales
- Evaluar la bondad de ajuste
- Detectar valores atípicos
Para crear un modelo lineal que permita ajustar curvas y superficies a sus datos, consulte Curve Fitting Toolbox™.
Ejemplos y procedimientos
Referencias de software
También puede consultar estos temas: Regresión de series temporales