Main Content

La traducción de esta página aún no se ha actualizado a la versión más reciente. Haga clic aquí para ver la última versión en inglés.

kstest2

Prueba de Kolmogorov-Smirnov para dos muestras

Descripción

h = kstest2(x1,x2) devuelve una decisión de prueba para la hipótesis nula de que los datos de los vectores x1 y x2 proceden de la misma distribución continua, usando la prueba de Kolmogorov-Smirnov para dos muestras. La hipótesis alternativa es que x1 y x2 proceden de diferentes distribuciones continuas. El resultado h es 1 si la prueba rechaza la hipótesis nula al nivel de significación del 5%, y 0 en el caso contrario.

ejemplo

h = kstest2(x1,x2,Name,Value) devuelve una decisión de prueba de la prueba de Kolmogorov-Smirnov para dos muestras con opciones adicionales especificadas por uno o más argumentos de par nombre-valor. Por ejemplo, puede cambiar el nivel de significación o realizar una prueba unilateral.

ejemplo

[h,p] = kstest2(___) también devuelve el valor asintótico p, p, usando cualquiera de los argumentos de entrada de las sintaxis anteriores.

ejemplo

[h,p,ks2stat] = kstest2(___) devuelve también la estadística de prueba ks2stat.

ejemplo

Ejemplos

contraer todo

Genere datos de muestra de dos distribuciones de Weibull diferentes.

rng(1);     % For reproducibility
x1 = wblrnd(1,1,1,50);
x2 = wblrnd(1.2,2,1,50);

Pruebe la hipótesis nula de que los datos de los vectores x1 y x2 proceden de poblaciones con la misma distribución.

h = kstest2(x1,x2)
h = logical
   1

El valor devuelto de h = 1 indica que kstest rechaza la hipótesis nula al nivel de significación predeterminado del 5%.

Genere datos de muestra de dos distribuciones de Weibull diferentes.

rng(1);     % For reproducibility
x1 = wblrnd(1,1,1,50);
x2 = wblrnd(1.2,2,1,50);

Pruebe la hipótesis nula de que los vectores de datos x1 y x2 proceden de poblaciones con la misma distribución a un nivel de significación del 1%.

[h,p] = kstest2(x1,x2,'Alpha',0.01)
h = logical
   0

p = 0.0317

El valor devuelto de h = 0 indica que kstest no rechaza la hipótesis nula al nivel de significación del 1%.

Genere datos de muestra de dos distribuciones de Weibull diferentes.

rng(1);     % For reproducibility
x1 = wblrnd(1,1,1,50);
x2 = wblrnd(1.2,2,1,50);

Pruebe la hipótesis nula de que los datos de los vectores x1 y x2 proceden de poblaciones con la misma distribución frente a la hipótesis alternativa de que la cdf de la distribución de x1 es mayor que la cdf de la distribución de x2.

[h,p,k] = kstest2(x1,x2,'Tail','larger')
h = logical
   1

p = 0.0158
k = 0.2800

El valor devuelto de h = 1 indica que kstest rechaza la hipótesis nula a favor de la hipótesis alternativa de que la cdf de la distribución de x1 es mayor que la cdf de la distribución de x2 en el nivel de significación predeterminado del 5%. El valor devuelto de k es la estadística de la prueba para la prueba de Kolmogorov-Smirnov para dos muestras.

Argumentos de entrada

contraer todo

Datos de muestra de la primera muestra, especificados como un vector. Los vectores de datos x1 y x2 no es necesario que tengan el mismo tamaño.

Tipos de datos: single | double

Datos de muestra de la segunda muestra, especificados como un vector. Los vectores de datos x1 y x2 no es necesario que tengan el mismo tamaño.

Tipos de datos: single | double

Argumentos de par nombre-valor

Especifique pares de argumentos opcionales Name1=Value1,...,NameN=ValueN, donde Name es el nombre del argumento y Value es el valor correspondiente. Los argumentos nombre-valor deben aparecer después de otros argumentos, pero el orden de los pares no importa.

En versiones anteriores a R2021a, use comas para separar cada nombre y valor y encierre Name entre comillas.

Ejemplo: 'Tail','larger','Alpha',0.01 especifica una prueba utilizando la hipótesis alternativa de que la cdf empírica de x1 es mayor que la cdf empírica de x2, realizada al nivel de significación del 1%.

Nivel de significación de la prueba de hipótesis, especificado como el par separado por comas que consta de 'Alpha' y un valor de escalar en el rango (0,1).

Ejemplo: 'Alpha',0.01

Tipos de datos: single | double

Tipo de hipótesis alternativa que se desea evaluar, especificada como el par separado por comas que consta de 'Tail' y uno de los siguientes:

'unequal'Prueba la hipótesis alternativa de que la cdf empírica de x1 no es igual que la cdf empírica de x2.
'larger'Prueba la hipótesis alternativa de que la cdf empírica de x1 es mayor que la cdf empírica de x2.
'smaller'Prueba la hipótesis alternativa de que la cdf empírica de x1 es menor que la cdf empírica de x2.

Si los valores de los datos de x1 tienden a ser mayores que los de x2, la función de distribución empírica de x1 tiende a ser más pequeña que la de x2, y viceversa.

Ejemplo: 'Tail','larger'

Argumentos de salida

contraer todo

Resultado de la prueba de hipótesis, devuelto como un valor lógico.

  • Si h= 1, esto indica el rechazo de la hipótesis nula al nivel de significación Alpha.

  • Si h= 0, esto indica un error al rechazar la hipótesis nula al nivel de significación Alpha.

Valor p asintótico de la prueba, devuelto como un valor de escalar en el rango (0,1). p es la probabilidad de observar una estadística de prueba tan extrema o más que el valor observado bajo la hipótesis nula. El valor p asintótico se vuelve muy preciso para tamaños de muestra grandes y se considera razonablemente preciso para tamaños de muestra n1 y n2, siempre y cuando (n1*n2)/(n1 + n2)4.

Estadística de prueba, devuelta como un valor de escalar no negativo.

Más acerca de

contraer todo

Prueba de Kolmogorov-Smirnov para dos muestras

La prueba de Kolmogorov-Smirnov para dos muestras es una prueba de hipótesis no paramétrica que evalúa la diferencia entre las cdf de las distribuciones de los dos vectores de datos de muestra en el rango de x en cada conjunto de datos.

La prueba de dos muestras utiliza la máxima diferencia absoluta entre las cdf de las distribuciones de los dos vectores de datos. La estadística de prueba es

D*=maxx(|F^1(x)F^2(x)|),

donde F^1(x) es la proporción de los valores x1 menores que o iguales a x y F^2(x) es la proporción de los valores x2 menores que o iguales a x.

La prueba de una muestra utiliza el valor real de la diferencia entre las cdf de las distribuciones de los dos vectores de datos en lugar del valor absoluto. La estadística de prueba es

D*=maxx(F^1(x)F^2(x)).

Algoritmos

En kstest2, la decisión de rechazar la hipótesis nula se basa en la comparación del valor p p con el nivel de significación Alpha, no comparando la estadística de prueba ks2stat con un valor crítico.

Referencias

[1] Massey, F. J. “The Kolmogorov-Smirnov Test for Goodness of Fit.” Journal of the American Statistical Association. Vol. 46, No. 253, 1951, pp. 68–78.

[2] Miller, L. H. “Table of Percentage Points of Kolmogorov Statistics.” Journal of the American Statistical Association. Vol. 51, No. 273, 1956, pp. 111–121.

[3] Marsaglia, G., W. Tsang, and J. Wang. “Evaluating Kolmogorov’s Distribution.” Journal of Statistical Software. Vol. 8, Issue 18, 2003.

Historial de versiones

Introducido antes de R2006a

Consulte también

| |