Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

zscore

Puntuaciones estandarizadasz

Descripción

ejemplo

Z = zscore(X) devuelve el -puntuaciónz para cada elemento de tal que las columnas de se centran para tener la media 0 y se escalan para tener la desviación estándar 1. es del mismo tamaño que .XXZX

  • Si es un vector, entonces es un vector de -scores.XZz

  • Si es una matriz, entonces es una matriz del mismo tamaño que , y cada columna de tiene la media 0 y la desviación estándar 1.XZXZ

  • Para , -scores in se calculan a lo largo de la de .matrices multidimensionaleszZprimera dimensión no singletónX

ejemplo

Z = zscore(X,flag) escalas utilizando la desviación estándar indicada por .Xflag

ejemplo

Z = zscore(X,flag,'all') estandariza utilizando la media y la desviación estándar de todos los valores en .XX

ejemplo

Z = zscore(X,flag,dim) estandariza a lo largo de la dimensión operativa.Xdim Por ejemplo, para una matriz , si es 1, a continuación, utiliza las medias y las desviaciones estándar a lo largo de las columnas de , si es 2, a continuación, utiliza las medias y las desviaciones estándar a lo largo de las filas de .XdimzscoreXdimzscoreX

ejemplo

Z = zscore(X,flag,vecdim) estandariza sobre las dimensiones especificadas por el vector .Xvecdim Por ejemplo, si es una matriz, es equivalente a porque cada elemento de una matriz está contenido en el sector de matriz definido por las dimensiones 1 y 2.Xzscore(X,0,[1 2])zscore(X,0,'all')

ejemplo

[Z,mu,sigma] = zscore(___) también devuelve las medias y las desviaciones estándar utilizadas para el centrado y la escala, y , respectivamente.musigma Puede utilizar cualquiera de los argumentos de entrada de las sintaxis anteriores.

Ejemplos

contraer todo

Calcular y trazar el

<math display="block">
<mrow>
<mi>z</mi>
</mrow>
</math>
-puntuaciones de dos vectores de datos y, a continuación, compare los resultados.

Cargue los datos de ejemplo.

load lawdata

Dos variables se cargan en el espacio de trabajo: y .gpalsat

Trazar ambas variables en los mismos ejes.

plot([gpa,lsat]) legend('gpa','lsat','Location','East')

Es difícil comparar estas dos medidas porque están en una escala muy diferente.

Trazar el

<math display="block">
<mrow>
<mi>z</mi>
</mrow>
</math>
-puntuaciones de y en los mismos ejes.gpalsat

Zgpa = zscore(gpa); Zlsat = zscore(lsat); plot([Zgpa, Zlsat]) legend('gpa z-scores','lsat z-scores','Location','Northeast')

Ahora, puede ver el rendimiento relativo de las personas con respecto a sus resultados y los resultados.gpalsat Por ejemplo, los resultados y los de la tercera persona son una desviación estándar por debajo de la media de la muestra.gpalsat El undécimo individuo está alrededor de la media de la muestra, pero tiene una puntuación de casi 1,25 desviaciones estándar por encima del promedio de la muestra.gpalsat

Compruebe la media y la desviación estándar de la

<math display="block">
<mrow>
<mi>z</mi>
</mrow>
</math>
-puntuaciones que ha creado.

 mean([Zgpa,Zlsat])
ans = 1×2
10-14 ×

   -0.1088    0.0357

 std([Zgpa,Zlsat])
ans = 1×2

     1     1

Por definición,

<math display="block">
<mrow>
<mi>z</mi>
</mrow>
</math>
-puntuaciones de y tienen la media 0 y la desviación estándar 1.gpalsat

Cargue los datos de ejemplo.

load lawdata

Dos variables se cargan en el espacio de trabajo: y .gpalsat

Calcular el

<math display="block">
<mrow>
<mi>z</mi>
</mrow>
</math>
-puntuaciones de uso de la fórmula de población para la desviación estándar.gpa

Z1 = zscore(gpa,1); % population formula Z0 = zscore(gpa,0); % sample formula disp([Z1 Z0])
    1.2554    1.2128     0.8728    0.8432    -1.2100   -1.1690    -0.2749   -0.2656     1.4679    1.4181    -0.1049   -0.1013    -0.4024   -0.3888     1.4254    1.3771     1.1279    1.0896     0.1502    0.1451     0.1077    0.1040    -1.5076   -1.4565    -1.4226   -1.3743    -0.9125   -0.8815    -0.5724   -0.5530 

Para una muestra de una población, la fórmula de desviación estándar de la población con

<math display="block">
<mrow>
<mi>n</mi>
</mrow>
</math>
en el denominador corresponde a la estimación de probabilidad máxima de la desviación estándar de la población, y podría ser sesgado. La fórmula de desviación estándar de la muestra, por otro lado, es el estimador imparcial de la desviación estándar de la población para una muestra.

Calcular

<math display="block">
<mrow>
<mi>z</mi>
</mrow>
</math>
-puntuaciones utilizando la media y la desviación estándar calculadas a lo largo de las columnas o filas de una matriz de datos.

Cargue los datos de ejemplo.

load flu

La matriz de conjuntos de datos se carga en el lugar de trabajo. tiene 52 observaciones sobre 11 variables.fluflu La primera variable contiene fechas (en semanas). Las otras variables contienen las estimaciones de gripe para diferentes regiones de los EE. UU.

Convierta la matriz de conjuntos de datos en una matriz de datos.

flu2 = double(flu(:,2:end));

La nueva matriz de datos, , es una matriz de datos doble de 52 por 10.flu2 Las filas corresponden a las semanas y las columnas corresponden a las regiones de EE. UU. en la matriz del conjunto de datos.flu

Estandarizar la estimación de gripe para cada región (el de ).Columnasflu2

Z1 = zscore(flu2,[ ],1);

Se puede ver el

<math display="block">
<mrow>
<mi>z</mi>
</mrow>
</math>
-puntuaciones en el editor de variables haciendo doble clic en la matriz creada en el espacio de trabajo.Z1

Estandarizar la estimación de gripe para cada semana (el de ).Filasflu2

Z2 = zscore(flu2,[ ],2);

Busque las puntuaciones z de una matriz multidimensional especificando estandarizar los datos a lo largo de diferentes dimensiones. Compare los resultados al utilizar los argumentos , , y input.'all'dimvecdim

Cree una matriz de 3 por 4 por 2.

X = reshape(1:24,[3 4 2])
X =  X(:,:,1) =       1     4     7    10      2     5     8    11      3     6     9    12   X(:,:,2) =      13    16    19    22     14    17    20    23     15    18    21    24  

Estandarizar utilizando la media y la desviación estándar de todos los valores en .XX

Zall = zscore(X,0,'all')
Zall =  Zall(:,:,1) =     -1.6263   -1.2021   -0.7778   -0.3536    -1.4849   -1.0607   -0.6364   -0.2121    -1.3435   -0.9192   -0.4950   -0.0707   Zall(:,:,2) =      0.0707    0.4950    0.9192    1.3435     0.2121    0.6364    1.0607    1.4849     0.3536    0.7778    1.2021    1.6263  

La matriz multidimensional resultante de puntuaciones z tiene la media 0 y la desviación estándar 1. Por ejemplo, calcule la media y la desviación estándar de .Zall

mZall = mean(Zall(:,:,:),'all')
mZall = -9.2519e-18 
sZall = std(Zall(:,:,:),0,'all')
sZall = 1.0000 

Ahora estandarizar a lo largo de la segunda dimensión.X

Zdim = zscore(X,0,2)
Zdim =  Zdim(:,:,1) =     -1.1619   -0.3873    0.3873    1.1619    -1.1619   -0.3873    0.3873    1.1619    -1.1619   -0.3873    0.3873    1.1619   Zdim(:,:,2) =     -1.1619   -0.3873    0.3873    1.1619    -1.1619   -0.3873    0.3873    1.1619    -1.1619   -0.3873    0.3873    1.1619  

Los elementos de cada fila de cada página tienen la media 0 y la desviación estándar 1.Zdim Por ejemplo, calcule la media y la desviación estándar de la primera fila de la segunda página de .Zdim

mZdim = mean(Zdim(1,:,2),'all')
mZdim = 0 
sZdim = std(Zdim(1,:,2),0,'all')
sZdim = 1 

Por último, estandarizar en función de la segunda y tercera dimensión.X

Zvecdim = zscore(X,0,[2 3])
Zvecdim =  Zvecdim(:,:,1) =     -1.4289   -1.0206   -0.6124   -0.2041    -1.4289   -1.0206   -0.6124   -0.2041    -1.4289   -1.0206   -0.6124   -0.2041   Zvecdim(:,:,2) =      0.2041    0.6124    1.0206    1.4289     0.2041    0.6124    1.0206    1.4289     0.2041    0.6124    1.0206    1.4289  

Los elementos de cada rebanada tienen la media 0 y la desviación estándar 1.Zvecdim(i,:,:) Por ejemplo, calcule la media y la desviación estándar de los elementos en .Zvecdim(1,:,:)

mZvecdim = mean(Zvecdim(1,:,:),'all')
mZvecdim = 2.7756e-17 
sZvecdim = std(Zvecdim(1,:,:),0,'all')
sZvecdim = 1 

Devolver la media y la desviación estándar utilizadas para calcular la

<math display="block">
<mrow>
<mi>z</mi>
</mrow>
</math>
-puntuaciones.

Cargue los datos de ejemplo.

load lawdata

Dos variables se cargan en el espacio de trabajo: y .gpalsat

Devolver el

<math display="block">
<mrow>
<mi>z</mi>
</mrow>
</math>
-puntuaciones, media y desviación estándar de .gpa

[Z,gpamean,gpastdev] = zscore(gpa)
Z = 15×1

    1.2128
    0.8432
   -1.1690
   -0.2656
    1.4181
   -0.1013
   -0.3888
    1.3771
    1.0896
    0.1451
      ⋮

gpamean = 3.0947 
gpastdev = 0.2435 

Argumentos de entrada

contraer todo

Datos de entrada, especificados como vector, matriz o matriz multidimensional.

Tipos de datos: double | single

Indicador de la desviación estándar utilizado para calcular las puntuaciones, especificadas como 0 o 1.z

Dimensión a lo largo de la cual calcular las puntuaciones de , especificadas como un escalar entero positivo.zX Si no especifica un valor, el valor predeterminado es la primera dimensión de matriz cuyo tamaño no es igual a 1.

Por ejemplo, para una matriz, si es 1, a continuación, utiliza las medias y las desviaciones estándar a lo largo de las columnas de , y si es 2, a continuación, utiliza las medias y las desviaciones estándar a lo largo de las filas de .XdimzscoreXdimzscoreX

Vector de dimensiones a lo largo del cual calcular las puntuaciones de , especificadas como un vector entero positivo.zX Cada elemento de representa una dimensión de la matriz de entrada .vecdimX La salida tiene las mismas dimensiones que , pero la media y la desviación estándar tienen cada longitud 1 en las dimensiones operativas.ZXmusigma Las otras longitudes de cota son las mismas para , , y .Xmusigma

Por ejemplo, si es una matriz de 2 por 3 por 3, utiliza las medias y las desviaciones estándar a lo largo de las páginas para estandarizar los valores de .Xzscore(X,0,[1 2])XX

Tipos de datos: single | double

Argumentos de salida

contraer todo

puntuaciones, devueltas como vector, matriz o matriz multidimensional. tiene las mismas dimensiones que .z-ZX

Los valores de dependen de si se especifica , , o .Z'all'dimvecdim Si no especifica ninguno de estos argumentos de entrada, se aplican las siguientes condiciones:

  • Si es un vector, entonces es un vector de -scores con media 0 y varianza 1.XZz

  • Si es una matriz, se estandariza a lo largo de la primera dimensión nonsingleton de .XzscoreX

Para obtener un ejemplo que muestra las diferencias en el uso de , , y , vea .Z'all'dimvecdimPuntuaciones Z de la matriz multidimensional

Media utilizada para calcular las puntuaciones, devueltas como una matriz escalar, vectorial, de matriz o multidimensional. tiene una longitud 1 en las dimensiones de funcionamiento especificadas.Xzmu Las otras longitudes de dimensión son las mismas para y .Xmu

Por ejemplo, si es una matriz de 2 por 3 por 3 y es , entonces es una matriz de medios de 1-por-1 por 3.Xvecdim[1 2]mu Cada valor en corresponde a la media de una página en .muX

Desviación estándar de utilizada para calcular las puntuaciones, devueltas como una matriz escalar, vectorial, matriz o multidimensional. tiene una longitud 1 en las dimensiones de funcionamiento especificadas.Xzsigma Las otras longitudes de dimensión son las mismas para y .Xsigma

Por ejemplo, si es una matriz de 2 por 3 por 3 y es , entonces es una matriz de 1-por-1 por 3 de desviaciones estándar.Xvecdim[1 2]sigma Cada valor en corresponde a la desviación estándar de una página en .sigmaX

Más acerca de

contraer todo

Puntuación Z

Para una variable aleatoria con la media de la media y la desviación estándar, la puntuación de un valor esXzx

z=(xμ)σ.

Para datos de muestra con media X¯ y la desviación estándar, la puntuación de un punto de datos esSzx

z=(xX¯)S.

-las puntuaciones miden la distancia de un punto de datos de la media en términos de la desviación estándar.z Esto también se llama de datos.Normalización El conjunto de datos estandarizado tiene la media 0 y la desviación estándar 1, y conserva las propiedades de forma del conjunto de datos original (misma asimetría y kurtosis).

Puede utilizar -scores para colocar datos en la misma escala antes de realizar un análisis posterior.z Esto le permite comparar dos o más conjuntos de datos con unidades diferentes.

Matriz multidimensional

A es una matriz con más de dos dimensiones.matriz multidimensional Por ejemplo, si X es una matriz 1-by-3-by-4, entonces es una matriz tridimensional.X

Primera dimensión de nonsingleton

A es la primera dimensión de una matriz cuyo tamaño no es igual a 1.primera dimensión no singletón Por ejemplo, si es una matriz 1-by-2-by-3-by-4, la segunda dimensión es la primera dimensión nonsingleton de .XX

Desviación estándar de la muestra

El es dado pordesviación estándar de la muestraS

S=i=1n(xiX¯)2n1.

es la raíz cuadrada de un estimador imparcial de la varianza de la población de la que se extrae, siempre y cuando consista en muestras independientes, distribuidas de forma idéntica.SXX X¯ es la media de la muestra.

Observe que el denominador en esta fórmula de varianza es – 1.n

Desviación estándar de la población

Si los datos son toda la población de valores, puede utilizar el archivo ,desviación estándar de la población

σ=i=1n(xiμ)2n.

Si es una muestra aleatoria de una población, entonces la media se estima por la media de la muestra, y es el estimador de probabilidad máxima sesgado de la desviación estándar de la población.Xμσ

Observe que el denominador de esta fórmula de desviación es .n

Algoritmos

devuelve s para cualquier muestra que contenga s.zscoreNaNNaN

devuelve s para cualquier muestra que sea constante (todos los valores son iguales).zscore0 Por ejemplo, si es un vector del mismo valor numérico, entonces es un vector de s.XZ0

Capacidades ampliadas

Consulte también

|

Introducido antes de R2006a