Main Content

signrank

Prueba de los rangos con signo de Wilcoxon

Descripción

ejemplo

p = signrank(x) devuelve el valor p de una prueba de los rangos con signo de Wilcoxon bilateral.

signrank prueba la hipótesis nula de que los datos del vector x proceden de una distribución cuya mediana es cero a un nivel de significación del 5%. La prueba asume que los datos de x proceden de una distribución continua simétrica en torno a su mediana.

ejemplo

p = signrank(x,y) devuelve el valor p de una prueba emparejada bilateral para la hipótesis nula de que xy procede de una distribución cuya mediana es cero.

p = signrank(x,y,Name,Value) devuelve el valor p de la prueba de signo con más opciones especificadas por uno o más argumentos de par Name,Value.

[p,h] = signrank(___) también devuelve un valor lógico que indica la decisión de la prueba. h = 1 indica un rechazo de la hipótesis nula, y h = 0 indica un error al rechazar la hipótesis nula al nivel de significación del 5%. Puede utilizar cualquiera de los argumentos de entrada de las sintaxis anteriores.

ejemplo

[p,h,stats] = signrank(___) devuelve también la estructura stats con información sobre la estadística de la prueba.

ejemplo

[___] = signrank(x,m) devuelve cualquiera de los argumentos de salida en las sintaxis anteriores para la hipótesis nula de que los datos de x son observaciones de una distribución con mediana m.

ejemplo

[___] = signrank(x,m,Name,Value) devuelve cualquier argumento de salida de las sintaxis anteriores para la prueba de los rangos con signo con opciones adicionales especificadas por uno o más argumentos de par Name, Value.

Ejemplos

contraer todo

Pruebe la hipótesis de mediana cero.

Genere los datos de muestra.

rng('default') % for reproducibility
x = randn(1,25) + 1.30;

Pruebe la hipótesis de que los datos de x tienen mediana cero.

[p,h] = signrank(x)
p = 3.2229e-05
h = logical
   1

Al nivel de significación predeterminado del 5%, el valor h = 1 indica que la prueba rechaza la hipótesis nula de mediana cero.

Pruebe la hipótesis de mediana cero para la diferencia entre muestras emparejadas.

Genere los datos de muestra.

rng('default') % for reproducibility
x = lognrnd(2,.25,10,1);
y = x + trnd(2,10,1);

Pruebe la hipótesis de que xy tiene mediana cero.

[p,h] = signrank(x,y)
p = 0.3223
h = logical
   0

Los resultados indican que la prueba no rechaza la hipótesis nula de mediana cero en la diferencia al nivel de significación predeterminado del 5%.

Realice una prueba de los rangos con signo en una muestra grande utilizando la aproximación.

Cargue los datos de muestra.

load('gradespaired.mat');

Pruebe la hipótesis nula de que la mediana de las diferencias entre notas de los alumnos antes y después de participar en un programa de clases particulares es 0, frente a la hipótesis alternativa de que es menor que 0.

[p,h,stats] = signrank(gradespaired(:,1),...
		gradespaired(:,2),'tail','left')
p = 0.0047
h = logical
   1

stats = struct with fields:
          zval: -2.5982
    signedrank: 2.0175e+03

Dado que el tamaño de la muestra es superior a 15, signrank utiliza un método aproximado para calcular el valor p y también devuelve el valor de la estadística z. El valor h = 1 indica que la prueba rechaza la hipótesis nula de que no hay diferencia entre las medianas de las notas al nivel de significación del 5%. Hay suficientes pruebas estadísticas para concluir que la mediana de la nota de los alumnos antes de participar en el programa de clases particulares es inferior a la mediana de la nota después de participar.

Repita la prueba utilizando el método exacto.

[p,h,stats] = signrank(gradespaired(:,1),gradespaired(:,2),...
		'tail','left','method','exact')
p = 0.0045
h = logical
   1

stats = struct with fields:
    signedrank: 2.0175e+03

Los resultados obtenidos utilizando el método aproximado son congruentes con el método exacto.

Cargue los datos de muestra.

load mileage

Los datos contienen el consumo por galón para tres tipos diferentes de coches en las columnas 1 a 3.

Pruebe la hipótesis de que la mediana del consumo para el tipo de coches de la segunda columna difiere de 33.

[p,h,stats] = signrank(mileage(:,2),33)
p = 0.0312
h = logical
   1

stats = struct with fields:
    signedrank: 21

Al nivel de significación del 5%, los resultados indican que la mediana del consumo para el segundo tipo de coches difiere de 33. Tenga en cuenta que signrank utiliza un método exacto para calcular el valor de p para muestras pequeñas y no devuelve la estadística z.

Utilice el argumento de par nombre-valor de signrank.

Cargue los datos de muestra.

load mileage

Los datos contienen el consumo por galón para tres tipos diferentes de coches en las columnas 1 a 3.

Pruebe la hipótesis de que la mediana del consumo para el tipo de coches de la segunda fila es mayor que 33.

[p,h,stats] = signrank(mileage(:,2),33,'tail','right')
p = 0.0156
h = logical
   1

stats = struct with fields:
    signedrank: 21

Repita la misma prueba al nivel de significación del 1% utilizando el método aproximado.

[p,h,stats] = signrank(mileage(:,2),33,'tail','right',...
'alpha',0.01,'method','approximate')
p = 0.0180
h = logical
   0

stats = struct with fields:
          zval: 2.0966
    signedrank: 21

Este resultado, h = 0, indica que la hipótesis nula no puede rechazarse al nivel de significación del 1%.

Argumentos de entrada

contraer todo

Los datos de muestra, especificados como un vector.

Tipos de datos: single | double

Datos de muestra, especificados como un vector. y debe tener la misma longitud que x.

Tipos de datos: single | double

Valor hipotético de la mediana, especificado como un escalar.

Ejemplo: signrank(x,10)

Tipos de datos: single | double

Argumentos de par nombre-valor

Especifique pares de argumentos opcionales Name1=Value1,...,NameN=ValueN, donde Name es el nombre del argumento y Value es el valor correspondiente. Los argumentos nombre-valor deben aparecer después de otros argumentos, pero el orden de los pares no importa.

En versiones anteriores a R2021a, use comas para separar cada nombre y valor y encierre Name entre comillas.

Ejemplo: 'alpha',0.01,'method','approximate','tail','right' especifica una prueba de rangos con signo de cola derecha con un nivel de significación del 1% que devuelve el valor p aproximado.

El nivel de significación de la decisión de una prueba de hipótesis, especificado como el par separado por comas que consta de 'alpha' y un valor de escalar en el rango del 0 al 1. El nivel de significación de h es 100 * alpha%.

Ejemplo: 'alpha', 0.01

Tipos de datos: double | single

Método de cálculo de p, especificado como el par separado por comas que consta de 'method' y uno de los siguientes:

'exact'El cálculo exacto del valor p, p. Valor predeterminado para 15 o menos observaciones en x, xm o xy cuando method no está especificado.
'approximate'La aproximación normal al calcular el valor p, p. Valor predeterminado para más de 15 observaciones en x, xm o xy cuando 'method' no está especificado porque el método exacto puede ser lento para muestras grandes.

Ejemplo: 'method','exact'

Tipo de prueba, especificado como el par separado por comas que consta de 'tail' y uno de los siguientes:

'both'

Prueba de hipótesis bilateral, que es el tipo de prueba predeterminado.

  • Para una prueba de una muestra, la hipótesis alternativa afirma que los datos de x proceden de una distribución continua con mediana distinta de 0 o m.

  • Para una prueba de dos muestras, la hipótesis alternativa afirma que los datos de xy proceden de una distribución con mediana distinta de 0.

'right'

Prueba de hipótesis de cola derecha.

  • Para una prueba de una muestra, la hipótesis alternativa afirma que los datos de x proceden de una distribución continua con mediana mayor que 0 o m.

  • Para una prueba de dos muestras, la hipótesis alternativa afirma que los datos de xy proceden de una distribución con mediana mayor que 0.

'left'

Prueba de hipótesis de cola izquierda.

  • Para una prueba de una muestra, la hipótesis alternativa afirma que los datos de x proceden de una distribución continua con mediana menor que 0 o m.

  • Para una prueba de dos muestras, la hipótesis alternativa afirma que los datos de xy proceden de una distribución con mediana menor que 0.

Ejemplo: 'tail','left'

Argumentos de salida

contraer todo

El valor p de la prueba, devuelto como un escalar no negativo del 0 al 1. p es la probabilidad de observar una estadística de prueba tan extrema o más que el valor observado bajo la hipótesis nula. signrank calcula el valor p bilateral duplicando el valor unilateral más significativo.

El resultado de la prueba de hipótesis, devuelto como un valor lógico.

  • Si h = 1, esto indica el rechazo de la hipótesis nula al nivel de significación del 100 * alpha%.

  • Si h = 0, esto indica un error al rechazar la hipótesis nula al nivel de significación del 100 * alpha%.

Estadísticas de la prueba, devueltas como una estructura. Las estadísticas de la prueba almacenadas en stats son:

  • signrank: Valor de la estadística de la prueba de los rangos con signo.

  • zval: Valor de la estadística z (calculado cuando 'method' es 'approximate').

Más acerca de

contraer todo

Prueba de los rangos con signo de Wilcoxon

La prueba de los rangos con signo de Wilcoxon es una prueba no paramétrica para dos poblaciones cuando las observaciones están emparejadas. En este caso, la estadística de la prueba, W, es la suma de los rangos de las diferencias positivas entre las observaciones de las dos muestras (es decir, xy). Cuando se utiliza la prueba para una muestra, W es la suma de los rangos de las diferencias positivas entre las observaciones y el valor hipotético de la mediana M0 (que es 0 cuando se utiliza signrank(x) y m cuando se utiliza signrank(x,m)).

Estadística z

Para muestras grandes o cuando method es approximate, la función signrank calcula el valor de p utilizando la estadística z dada por

z=(Wn(n+1)/4)n(n+1)(2n+1)tieadj24,

donde n es el tamaño de la muestra de la diferencia x – y o xm. Para el caso de dos muestras, signrank utiliza [tie_rank,tieadj] = tiedrank(abs(diffxy),0,0,epsdiff) para obtener el valor de ajuste de los empates tieadj.

Algoritmos

signrank trata NaN en x e y como valores faltantes y los ignora.

Para el caso de dos muestras, signrank utiliza una tolerancia basada en los valores epsdiff = eps(x) + eps(y). signrank calcula los valores absolutos de las diferencias (abs(d(i)) donde d(i) = x(i) – y(i)) y los compara con epsdiff. Los valores con un valor absoluto inferior a epsdiff (abs(d(i)) < epsdiff(i)) se tratan como empates.

Referencias

[1] Gibbons, J. D., and S. Chakraborti. Nonparametric Statistical Inference, 5th Ed., Boca Raton, FL: Chapman & Hall/CRC Press, Taylor & Francis Group, 2011.

[2] Hollander, M., and D. A. Wolfe. Nonparametric Statistical Methods. Hoboken, NJ: John Wiley & Sons, Inc., 1999.

Historial de versiones

Introducido antes de R2006a

Consulte también

| | |