kstest2

Prueba de Kolmogorov-Smirnov para dos muestras

Sintaxis

h = kstest2(x1,x2)

h = kstest2(x1,x2,Name,Value)

[h,p] = kstest2(___)

[h,p,ks2stat] = kstest2(___)

Descripción

h = kstest2(x1,x2) devuelve una decisión de prueba para la hipótesis nula de que los datos de los vectores x1 y x2 proceden de la misma distribución continua, usando la prueba de Kolmogorov-Smirnov para dos muestras. La hipótesis alternativa es que x1 y x2 proceden de diferentes distribuciones continuas. El resultado h es 1 si la prueba rechaza la hipótesis nula al nivel de significación del 5%, y 0 en el caso contrario.

ejemplo

h = kstest2(x1,x2,Name,Value) devuelve una decisión de prueba de la prueba de Kolmogorov-Smirnov para dos muestras con opciones adicionales especificadas por uno o más argumentos de par nombre-valor. Por ejemplo, puede cambiar el nivel de significación o realizar una prueba unilateral.

ejemplo

[h,p] = kstest2(___) también devuelve el valor asintótico p, p, usando cualquiera de los argumentos de entrada de las sintaxis anteriores.

ejemplo

[h,p,ks2stat] = kstest2(___) devuelve también la estadística de prueba ks2stat.

ejemplo

Ejemplos

contraer todo

Probar dos muestras para la misma distribución

Abrir script en vivo

Genere datos de muestra de dos distribuciones de Weibull diferentes.

rng(1);     % For reproducibility
x1 = wblrnd(1,1,1,50);
x2 = wblrnd(1.2,2,1,50);

Pruebe la hipótesis nula de que los datos de los vectores x1 y x2 proceden de poblaciones con la misma distribución.

h = kstest2(x1,x2)

h = logical
   1

El valor devuelto de h = 1 indica que kstest rechaza la hipótesis nula al nivel de significación predeterminado del 5%.

Probar la hipótesis con distintos niveles de significación

Abrir script en vivo

Genere datos de muestra de dos distribuciones de Weibull diferentes.

rng(1);     % For reproducibility
x1 = wblrnd(1,1,1,50);
x2 = wblrnd(1.2,2,1,50);

Pruebe la hipótesis nula de que los vectores de datos x1 y x2 proceden de poblaciones con la misma distribución a un nivel de significación del 1%.

[h,p] = kstest2(x1,x2,'Alpha',0.01)

h = logical
   0

p = 
0.0317

El valor devuelto de h = 0 indica que kstest no rechaza la hipótesis nula al nivel de significación del 1%.

Prueba de hipótesis unilateral

Abrir script en vivo

Genere datos de muestra de dos distribuciones de Weibull diferentes.

rng(1);     % For reproducibility
x1 = wblrnd(1,1,1,50);
x2 = wblrnd(1.2,2,1,50);

Pruebe la hipótesis nula de que los datos de los vectores x1 y x2 proceden de poblaciones con la misma distribución frente a la hipótesis alternativa de que la cdf de la distribución de x1 es mayor que la cdf de la distribución de x2.

[h,p,k] = kstest2(x1,x2,'Tail','larger')

h = logical
   1

p = 
0.0158

k = 
0.2800

El valor devuelto de h = 1 indica que kstest rechaza la hipótesis nula a favor de la hipótesis alternativa de que la cdf de la distribución de x1 es mayor que la cdf de la distribución de x2 en el nivel de significación predeterminado del 5%. El valor devuelto de k es la estadística de la prueba para la prueba de Kolmogorov-Smirnov para dos muestras.

Argumentos de entrada

contraer todo

`x1` — Datos de muestra
vector

Datos de muestra de la primera muestra, especificados como un vector. Los vectores de datos x1 y x2 no es necesario que tengan el mismo tamaño.

Tipos de datos: single | double

`x2` — Datos de muestra
vector

Datos de muestra de la segunda muestra, especificados como un vector. Los vectores de datos x1 y x2 no es necesario que tengan el mismo tamaño.

Tipos de datos: single | double

Argumentos de par nombre-valor

contraer todo

Especifique pares de argumentos opcionales Name1=Value1,...,NameN=ValueN, donde Name es el nombre del argumento y Value es el valor correspondiente. Los argumentos nombre-valor deben aparecer después de otros argumentos, pero el orden de los pares no importa.

En versiones anteriores a R2021a, use comas para separar cada nombre y valor y encierre Name entre comillas.

Ejemplo: 'Tail','larger','Alpha',0.01 especifica una prueba utilizando la hipótesis alternativa de que la cdf de x1 es mayor que la cdf de x2, realizada al nivel de significación del 1%.

`Alpha` — Nivel de significación
`0.05` (predeterminado) | valor de escalar en el rango (0,1)

Nivel de significación de la prueba de hipótesis, especificado como el par separado por comas que consta de 'Alpha' y un valor de escalar en el rango (0,1).

Ejemplo: 'Alpha',0.01

Tipos de datos: single | double

`Tail` — Tipo de hipótesis alternativa
`'unequal'` (predeterminado) | `'larger'` | `'smaller'`

Tipo de hipótesis alternativa que se desea evaluar, especificada como el par separado por comas que consta de 'Tail' y uno de los siguientes:

`'unequal'`	Prueba la hipótesis alternativa de que la cdf de `x1` no es igual que la cdf de `x2`.
`'larger'`	Prueba la hipótesis alternativa de que la cdf de `x1` es estocásticamente mayor que la cdf de `x2`.
`'smaller'`	Prueba la hipótesis alternativa de que la cdf de `x1` es estocásticamente menor que la cdf de `x2`.

Si los valores de los datos de x1 tienden a ser mayores que los de x2, la función de distribución empírica de x1 tiende a ser más pequeña que la de x2, y viceversa.

Ejemplo: 'Tail','larger'

Argumentos de salida

contraer todo

`h` — Resultado de la prueba de hipótesis
`1` | `0`

Resultado de la prueba de hipótesis, devuelto como un valor lógico.

Si h= 1, esto indica el rechazo de la hipótesis nula al nivel de significación Alpha.
Si h= 0, esto indica un error al rechazar la hipótesis nula al nivel de significación Alpha.

`p` — Valor p asintótico
valor de escalar en el rango (0,1)

Valor p asintótico de la prueba, devuelto como un valor de escalar en el rango (0,1). p es la probabilidad de observar una estadística de prueba tan extrema o más que el valor observado bajo la hipótesis nula. El valor p asintótico se vuelve muy preciso para tamaños de muestra grandes y se considera razonablemente preciso para tamaños de muestra n1 y n2, siempre y cuando (n1*n2)/(n1 + n2) ≥ 4.

`ks2stat` — Estadística de prueba
valor de escalar no negativo

Estadística de prueba, devuelta como un valor de escalar no negativo.

Más acerca de

contraer todo

Prueba de Kolmogorov-Smirnov para dos muestras

La prueba de Kolmogorov-Smirnov para dos muestras es una prueba de hipótesis no paramétrica que evalúa la diferencia entre las cdf de las distribuciones de los dos vectores de datos de muestra en el rango de x en cada conjunto de datos.

La prueba de dos muestras ('Tail','unequal') utiliza la máxima diferencia absoluta entre las cdf empíricas de las distribuciones de los dos vectores de datos. La estadística de prueba es

$D^{*} = \max_{x} (| {\hat{F}}_{1} (x) - {\hat{F}}_{2} (x) |),$

donde ${\hat{F}}_{1} (x)$ es la proporción de los valores x1 menores que o iguales a x y ${\hat{F}}_{2} (x)$ es la proporción de los valores x2 menores que o iguales a x.

La prueba de una muestra utiliza el valor real de la diferencia entre las cdf empíricas de las distribuciones de los dos vectores de datos en lugar del valor absoluto. Si especifica 'Tail','larger', la estadística de prueba es

$D^{*} = \max_{x} ({\hat{F}}_{1} (x) - {\hat{F}}_{2} (x)) .$

Si especifica 'Tail','smaller', la estadística de prueba es

$D^{*} = \max_{x} ({\hat{F}}_{2} (x) - {\hat{F}}_{1} (x)) .$

Algoritmos

En kstest2, la decisión de rechazar la hipótesis nula se basa en la comparación del valor p p con el nivel de significación Alpha, no comparando la estadística de prueba ks2stat con un valor crítico.

Referencias

[1] Massey, F. J. “The Kolmogorov-Smirnov Test for Goodness of Fit.” Journal of the American Statistical Association. Vol. 46, No. 253, 1951, pp. 68–78.

[2] Miller, L. H. “Table of Percentage Points of Kolmogorov Statistics.” Journal of the American Statistical Association. Vol. 51, No. 273, 1956, pp. 111–121.

[3] Marsaglia, G., W. Tsang, and J. Wang. “Evaluating Kolmogorov’s Distribution.” Journal of Statistical Software. Vol. 8, Issue 18, 2003.

Historial de versiones

Introducido antes de R2006a

Consulte también

kstest | lillietest | adtest

kstest2

Sintaxis

Descripción

Ejemplos

Probar dos muestras para la misma distribución

Probar la hipótesis con distintos niveles de significación

Prueba de hipótesis unilateral

Argumentos de entrada

x1 — Datos de muestra vector

x2 — Datos de muestra vector

Argumentos de par nombre-valor

Alpha — Nivel de significación 0.05 (predeterminado) | valor de escalar en el rango (0,1)

Tail — Tipo de hipótesis alternativa 'unequal' (predeterminado) | 'larger' | 'smaller'

Argumentos de salida

h — Resultado de la prueba de hipótesis 1 | 0

p — Valor p asintótico valor de escalar en el rango (0,1)

ks2stat — Estadística de prueba valor de escalar no negativo

Más acerca de

Prueba de Kolmogorov-Smirnov para dos muestras

Algoritmos

Referencias

Historial de versiones

Consulte también

`x1` — Datos de muestra
vector

`x2` — Datos de muestra
vector

`Alpha` — Nivel de significación
`0.05` (predeterminado) | valor de escalar en el rango (0,1)

`Tail` — Tipo de hipótesis alternativa
`'unequal'` (predeterminado) | `'larger'` | `'smaller'`

`h` — Resultado de la prueba de hipótesis
`1` | `0`

`p` — Valor p asintótico
valor de escalar en el rango (0,1)

`ks2stat` — Estadística de prueba
valor de escalar no negativo