ranksum

Prueba de suma de rangos de Wilcoxon

Sintaxis

p = ranksum(x,y)

[p,h] = ranksum(x,y)

[p,h,stats] = ranksum(x,y)

[___] = ranksum(x,y,Name,Value)

Descripción

p = ranksum(x,y) devuelve el valor p de una prueba de suma de rangos de Wilcoxon bilateral. ranksum comprueba la hipótesis nula de que los datos de x e y son muestras de distribuciones continuas con medianas idénticas, frente a la alternativa de que no lo son. La prueba asume que las dos muestras son independientes. x e y pueden tener longitudes diferentes.

Esta prueba es equivalente a la prueba U de Mann Whitney.

ejemplo

[p,h] = ranksum(x,y) devuelve también un valor lógico que indica la decisión de la prueba. El resultado h = 1 indica un rechazo de la hipótesis nula, y h = 0 indica un error al rechazar la hipótesis nula al nivel de significación del 5%.

ejemplo

[p,h,stats] = ranksum(x,y) devuelve también la estructura stats con información sobre la estadística de la prueba.

ejemplo

[___] = ranksum(x,y,Name,Value) devuelve cualquier argumento de salida de las sintaxis anteriores para una prueba de suma de rangos con opciones adicionales especificadas por uno o más argumentos de par Name, Value.

ejemplo

Ejemplos

contraer todo

Prueba de igualdad de las medianas de dos poblaciones

Abrir script en vivo

Compruebe la hipótesis de igualdad entre las medianas de dos muestras independientes de tamaños desiguales.

Genere datos de muestra.

rng('default') % for reproducibility
x = unifrnd(0,1,10,1);
y = unifrnd(0.25,1.25,15,1);

Estas muestras proceden de poblaciones con distribuciones idénticas, salvo por un desplazamiento del 0,25 en la localización.

Compruebe la igualdad de las medianas de x e y.

p = ranksum(x,y)

p = 
0.0375

El valor $p$ de 0,0375 indica que ranksum rechaza la hipótesis nula de igualdad entre las medianas al nivel de significación predeterminado del 5%.

Estadísticas de la prueba de las medianas de dos poblaciones

Abrir script en vivo

Obtenga la estadística de la prueba de igualdad de las medianas de dos poblaciones.

Cargue los datos de muestra.

load mileage

Compruebe si el consumo de combustible es el mismo para el primer y el segundo tipo de coche.

[p,h,stats] = ranksum(mileage(:,1),mileage(:,2))

p = 
0.0043

h = logical
   1

stats = struct with fields:
    ranksum: 21.5000

El valor $p$ , 0,043, y h = 1 indican el rechazo de la hipótesis nula de igualdad entre las medianas al nivel de significación predeterminado del 5%. Dado que los tamaños de las muestras son reducidos (6 cada uno), ranksum calcula el valor $p$ usando el método exacto. La estructura stats incluye únicamente el valor de la estadística de la prueba de suma de rangos.

Aumento de la mediana

Abrir script en vivo

Compruebe la hipótesis de un aumento de la mediana de la población.

Cargue los datos de muestra.

load('weather.mat');

Los datos meteorológicos muestran las temperaturas altas diarias registradas en el mismo mes durante dos años consecutivos.

Realice una prueba del lado izquierdo para evaluar el aumento de la mediana al nivel de significación del 1%.

[p,h,stats] = ranksum(year1,year2,'alpha',0.01,...
'tail','left')

p = 
0.1271

h = logical
   0

stats = struct with fields:
       zval: -1.1403
    ranksum: 837.5000

Si nos basamos en el valor $p$ de 0,1271 y en el valor lógico h = 0, no existe evidencia suficiente para rechazar la hipótesis nula. Es decir, los resultados no demuestran la existencia de un desplazamiento positivo de la mediana de las temperaturas altas del mes entre el año 1 y el año 2 al nivel de significación del 1%. Observe que ranksum usa el método aproximado para calcular el valor $p$ debido al elevado tamaño de las muestras.

Use el método exacto para calcular el valor $p$ .

[p,h,stats] = ranksum(year1,year2,'alpha',0.01,...
'tail','left','method','exact')

p = 
0.1273

h = logical
   0

stats = struct with fields:
    ranksum: 837.5000

Los resultados de los métodos aproximado y exacto son congruentes entre sí.

Argumentos de entrada

contraer todo

`x` — Datos de muestra
vector

Los datos de muestra, especificados como un vector.

Tipos de datos: single | double

`y` — Datos de muestra
vector

Los datos de muestra, especificados como un vector. La longitud de y no tiene que ser la misma que la longitud de x.

Tipos de datos: single | double

Argumentos de par nombre-valor

contraer todo

Especifique pares de argumentos opcionales Name1=Value1,...,NameN=ValueN, donde Name es el nombre del argumento y Value es el valor correspondiente. Los argumentos nombre-valor deben aparecer después de otros argumentos, pero el orden de los pares no importa.

En versiones anteriores a R2021a, use comas para separar cada nombre y valor y encierre Name entre comillas.

Ejemplo: 'alpha',0.01,'method','approximate','tail','right' especifica una prueba de suma de rangos de cola derecha con un nivel de significación del 1% que devuelve el valor p aproximado.

`alpha` — Nivel de significación
0.05 (predeterminado) | valor de escalar en el rango del 0 al 1

El nivel de significación de la decisión de una prueba de hipótesis, especificado como el par separado por comas que consta de 'alpha' y un valor de escalar en el rango del 0 al 1. El nivel de significación de h es 100 * alpha%.

Ejemplo: 'alpha', 0.01

Tipos de datos: double | single

`method` — Método de cálculo del valor p
`'exact'` | `'approximate'`

El método de cálculo del valor p, p, especificado como el par separado por comas que consta de 'method' y uno de los siguientes:

`'exact'`	El cálculo exacto del valor p, `p`.
`'approximate'`	La aproximación normal al calcular el valor p, `p`.

Cuando 'method' no está especificado, el valor predeterminado es:

'exact' si min(n_x, n_y) < 10 y n_x + n_y < 20
'approximate' en caso contrario

n_x y n_y son los tamaños de las muestras de x e y, respectivamente.

Ejemplo: 'method','exact'

`tail` — Tipo de prueba
`'both'` (predeterminado) | `'right'` | `'left'`

Tipo de prueba, especificado como el par separado por comas que consta de 'tail' y uno de los siguientes:

`'both'`	Una prueba de hipótesis bilateral en la que la hipótesis alternativa afirma que `x` e `y` tienen diferentes medianas. El tipo de prueba predeterminado si no se especifica `'tail'`.
`'right'`	Una prueba de hipótesis de cola derecha en la que la hipótesis alternativa afirma que la mediana de `x` es mayor que la mediana de `y`.
`'left'`	Una prueba de hipótesis de cola izquierda en la que la hipótesis alternativa afirma que la mediana de `x` es menor que la mediana de `y`.

Ejemplo: 'tail','left'

Argumentos de salida

contraer todo

`p` — Valor p de la prueba
escalar no negativo

El valor p de la prueba, devuelto como un escalar positivo del 0 al 1. p es la probabilidad de observar una estadística de prueba tan extrema o más que el valor observado bajo la hipótesis nula. ranksum calcula el valor p bilateral duplicando el valor unilateral más significativo.

`h` — Resultado de la prueba de hipótesis
1 | 0

El resultado de la prueba de hipótesis, devuelto como un valor lógico.

Si h = 1, esto indica el rechazo de la hipótesis nula al nivel de significación del 100 * alpha%.
Si h = 0, esto indica un error al rechazar la hipótesis nula al nivel de significación del 100 * alpha%.

`stats` — Estadística de la prueba
estructura

Estadísticas de la prueba, devueltas como una estructura. Las estadísticas de la prueba almacenadas en stats son:

ranksum : Valor de la estadística de la prueba de suma de rangos
zval: El valor de la estadística z (calculado cuando 'method' es 'approximate')

Más acerca de

contraer todo

Prueba de suma de rangos de Wilcoxon

La prueba de suma de rangos de Wilcoxon es una prueba no paramétrica para dos poblaciones cuando las muestras son independientes. Si X e Y son muestras independientes con diferentes tamaños de muestra, la estadística de la prueba que devuelve ranksum es la suma de los rangos de la primera muestra.

La prueba de suma de rangos de Wilcoxon es equivalente a la prueba U de Mann Whitney. La prueba U de Mann Whitney es una prueba no paramétrica de igualdad de las medianas de las poblaciones de dos muestras independientes X e Y.

La estadística de la prueba U de Mann Whitney, U, es el número de veces que una y precede a una x en un arreglo ordenado de los elementos de dos muestras independientes X e Y. Está relacionada con la estadística de la suma de rangos de Wilcoxon de la siguiente forma: si X es una muestra de tamaño n_X,

$U = W - \frac{n_{X} (n_{X} + 1)}{2} .$

Estadística z

Cuando las muestras son grandes, ranksum usa una estadística z para calcular el valor p aproximado de la prueba.

Si X e Y son dos muestras independientes de tamaño n_X e n_Y, donde n_X < n_Y, la estadística de z es

$z = \frac{W - E (W)}{\sqrt{V (W)}} = \frac{W - [\frac{n_{X} n_{Y} + n_{X} (n_{X} + 1)}{2}] - 0.5 * s i g n (W - E (W))}{\sqrt{\frac{n_{X} n_{Y} (n_{X} + n_{Y} + 1 - t i e s c o r)}{12}}},$

con corrección de continuidad y ajuste de los empates. Aquí tiescor lo da

$t i e s c o r = \frac{2 * t i e a d j}{(n_{X} + n_{Y}) (n_{X} + n_{Y} - 1)},$

, donde ranksum usa [ranks,tieadj] = tiedrank(x,y) para obtener los ajustes de los empates. La distribución normal estándar da el valor p para esta estadística z.

Algoritmos

ranksum trata NaN en x e y como valores faltantes y los ignora.

En el caso de las pruebas bilaterales de medianas con diferentes tamaños de muestra, la estadística de la prueba que devuelve ranksum es la suma de los rangos de la primera muestra.

Referencias

[1] Gibbons, J. D., and S. Chakraborti. Nonparametric Statistical Inference, 5th Ed., Boca Raton, FL: Chapman & Hall/CRC Press, Taylor & Francis Group, 2011.

[2] Hollander, M., and D. A. Wolfe. Nonparametric Statistical Methods. Hoboken, NJ: John Wiley & Sons, Inc., 1999.

Historial de versiones

Introducido antes de R2006a

Consulte también

kruskalwallis | signrank | signtest | ttest2

ranksum

Sintaxis

Descripción

Ejemplos

Prueba de igualdad de las medianas de dos poblaciones

Estadísticas de la prueba de las medianas de dos poblaciones

Aumento de la mediana

Argumentos de entrada

x — Datos de muestra vector

y — Datos de muestra vector

Argumentos de par nombre-valor

alpha — Nivel de significación 0.05 (predeterminado) | valor de escalar en el rango del 0 al 1

method — Método de cálculo del valor p 'exact' | 'approximate'

tail — Tipo de prueba 'both' (predeterminado) | 'right' | 'left'

Argumentos de salida

p — Valor p de la prueba escalar no negativo

h — Resultado de la prueba de hipótesis 1 | 0

stats — Estadística de la prueba estructura

Más acerca de

Prueba de suma de rangos de Wilcoxon

Estadística z

Algoritmos

Referencias

Historial de versiones

Consulte también

`x` — Datos de muestra
vector

`y` — Datos de muestra
vector

`alpha` — Nivel de significación
0.05 (predeterminado) | valor de escalar en el rango del 0 al 1

`method` — Método de cálculo del valor p
`'exact'` | `'approximate'`

`tail` — Tipo de prueba
`'both'` (predeterminado) | `'right'` | `'left'`

`p` — Valor p de la prueba
escalar no negativo

`h` — Resultado de la prueba de hipótesis
1 | 0

`stats` — Estadística de la prueba
estructura