Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

Correlación lineal

Introducción

cuantifica la fuerza de una relación lineal entre dos variables.Correlation Cuando no hay correlación entre dos variables, entonces no hay tendencia a que los valores de las variables aumenten o disminuyan en tándem. Sin embargo, dos variables que no están correlacionadas no son necesariamente independientes, ya que pueden tener una relación no lineal.

Puede utilizar la correlación lineal para investigar si existe una relación lineal entre las variables sin tener que asumir o ajustar un modelo específico a sus datos. Dos variables que tienen una correlación lineal pequeña o no pueden tener una relación no lineal fuerte. Sin embargo, el cálculo de la correlación lineal antes de ajustar un modelo es una forma útil de identificar variables que tienen una relación simple. Otra forma de explorar cómo se relacionan las variables es hacer parcelas de dispersión de sus datos.

cuantifica la fuerza de una relación lineal entre dos variables en unidades relativas a sus varianzas.Covariance Las correlaciones son covarianzas estandarizadas, que dan una cantidad sin dimensiones que mide el grado de una relación lineal, separada de la escala de cualquiera de las variables.

Las siguientes funciones calculan los coeficientes de correlación y la covarianza de la muestra.MATLAB® Estos coeficientes de muestreo son estimaciones de la verdadera covarianza y los coeficientes de correlación de la población a partir de la cual se dibuja la muestra de datos.

Función

Descripción

corrcoef

Matriz de coeficiente de correlación

cov

Matriz de covarianza

xcorr

Secuencia de correlación cruzada de un proceso aleatorio (incluye autocorrelación)

Covarianza

Utilice la función para calcular la matriz de covarianza de muestra para una matriz de datos (donde cada columna representa una cantidad independiente).MATLABcov

La matriz de covarianza de muestra tiene las siguientes propiedades:

  • es simétrico.cov(X)

  • es un vector de varianzas para cada columna de datos.diag(cov(X)) Las desviaciones representan una medida del spread o dispersión de los datos en la columna correspondiente. (La función calcula la varianza.)var

  • es un vector de desviaciones estándar.sqrt(diag(cov(X))) (La función calcula la desviación estándar.)std

  • Los elementos fuera de la diagonal de la matriz de covarianza representan las covarianzas entre las columnas de datos individuales.

Aquí, puede ser un vector o una matriz.X Para una matriz, la matriz de covarianzas es-por-. mnnn

Para obtener un ejemplo de cálculo de la covarianza, cargue los datos de muestra que contengan una matriz de 24 por 3:count.dat

load count.dat

Calcule la matriz de covarianza para estos datos:

cov(count)

responde con el siguiente resultado:MATLAB

ans =     1.0e+003 *        0.6437  0.9802  1.6567        0.9802  1.7144  2.6908        1.6567  2.6908  4.6278

La matriz de covarianzas para estos datos tiene la siguiente forma:

[s211s212s213s221s222s223s231s232s233]s2ij=s2ji

Aquí s2ij es la covarianza de muestra entre la columna y la columna de los datos.ij Dado que la matriz contiene tres columnas, la matriz de covarianza es de 3 por 3.count

Nota

En el caso especial cuando un vector es el argumento de, la función devuelve la varianza.cov

Coeficientes de correlación

La función produce una matriz de coeficientes de correlación de muestra para una matriz de datos (donde cada columna representa una cantidad independiente).MATLABcorrcoef Los coeficientes de correlación oscilan entre-1 y 1, donde

  • Los valores cercanos a 1 indican que hay una relación lineal positiva entre las columnas de datos.

  • Los valores cercanos a-1 indican que una columna de datos tiene una relación lineal negativa con otra columna de datos ().anticorrelation

  • Los valores cercanos o iguales a 0 sugieren que no hay ninguna relación lineal entre las columnas de datos.

Para una-por-matriz, la matriz de coeficiente de correlación es-por-. mnnn La disposición de los elementos en la matriz de coeficiente de correlación corresponde a la ubicación de los elementos en la matriz de covarianza, como se describe en.Covarianza

Para obtener un ejemplo de cálculo de los coeficientes de correlación, cargue los datos de muestra que contengan una matriz de 24 por 3:count.dat

load count.dat

Escriba la siguiente sintaxis para calcular los coeficientes de correlación:

corrcoef(count) 

Esto da como resultado la siguiente matriz de coeficientes de correlación de 3 por 3:

ans =      1.0000    0.9331    0.9599     0.9331    1.0000    0.9553     0.9599    0.9553    1.0000 

Dado que todos los coeficientes de correlación son cercanos a 1, hay una fuerte correlación positiva entre cada par de columnas de datos en la matriz.count