Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

multcompare

Prueba de comparación múltiple

Descripción

ejemplo

c = multcompare(stats) devuelve una matriz de los resultados de comparación por pares de una prueba de comparación múltiple utilizando la información contenida en la estructura. también muestra un gráfico interactivo de las estimaciones y los intervalos de comparación.cstatsmultcompare Cada media de grupo está representada por un símbolo y el intervalo se representa mediante una línea que se extiende desde el símbolo. Dos medios de grupo son significativamente diferentes si sus intervalos son desarticulados; no son significativamente diferentes si sus intervalos se superponen. Si utiliza el ratón para seleccionar cualquier grupo, el gráfico resaltará todos los demás grupos que sean significativamente diferentes, si los hay.

ejemplo

c = multcompare(stats,Name,Value) devuelve una matriz de resultados de comparación por pares, utilizando opciones adicionales especificadas por uno o más argumentos de par.cName,Value Por ejemplo, puede especificar el intervalo de confianza o el tipo de valor crítico que se usará en la comparación múltiple.

[c,m] = multcompare(___) también devuelve una matriz, , que contiene valores estimados de los medios (o cualquier estadística que se esté comparando) para cada grupo y los errores estándar correspondientes.m Puede utilizar cualquiera de las sintaxis anteriores.

[c,m,h] = multcompare(___) también devuelve un identificador, , al gráfico de comparación.h

ejemplo

[c,m,h,gnames] = multcompare(___) también devuelve una matriz de celdas, , que contiene los nombres de los grupos.gnames

Ejemplos

contraer todo

Cargue los datos de ejemplo.

load carsmall

Realizar un análisis unidireccional de la varianza (ANOVA) para ver si hay alguna diferencia entre el kilometraje de los coches por origen.

[p,t,stats] = anova1(MPG,Origin,'off');

Realice una comparación múltiple de los medios del grupo.

[c,m,h,nms] = multcompare(stats);

muestra las estimaciones con intervalos de comparación a su alrededor.multcompare Puede hacer clic en los gráficos de cada país para comparar su media con las de otros países.

Ahora muestre las estimaciones medias y los errores estándar con los nombres de grupo correspondientes.

[nms num2cell(m)]
ans=6×3 cell
    {'USA'    }    {[21.1328]}    {[0.8814]}
    {'Japan'  }    {[31.8000]}    {[1.8206]}
    {'Germany'}    {[28.4444]}    {[2.3504]}
    {'France' }    {[23.6667]}    {[4.0711]}
    {'Sweden' }    {[22.5000]}    {[4.9860]}
    {'Italy'  }    {[     28]}    {[7.0513]}

Cargue los datos de ejemplo.

load popcorn popcorn
popcorn = 6×3

    5.5000    4.5000    3.5000
    5.5000    4.5000    4.0000
    6.0000    4.0000    3.0000
    6.5000    5.0000    4.0000
    7.0000    5.5000    5.0000
    7.0000    5.0000    4.5000

Los datos provienen de un estudio de marcas de palomitas de maíz y tipos de popper (Hogg 1987). Las columnas de la matriz son marcas (Gourmet, Nacional y Genérico).popcorn Las filas son tipos de popper aceite y aire. En el estudio, los investigadores extraen un lote de cada marca tres veces con cada popper. Los valores son el rendimiento en tazas de palomitas de maíz reventadas.

Realice un ANOVA bidireccional. También calcule las estadísticas que necesita para realizar una prueba de comparación múltiple sobre los efectos principales.

[~,~,stats] = anova2(popcorn,3,'off')
stats = struct with fields:
      source: 'anova2'
     sigmasq: 0.1389
    colmeans: [6.2500 4.7500 4]
        coln: 6
    rowmeans: [4.5000 5.5000]
        rown: 9
       inter: 1
        pval: 0.7462
          df: 12

La estructura incluyestats

  • El error cuadrado medio ( )sigmasq

  • Las estimaciones del rendimiento medio de cada marca de palomitas de maíz ( )colmeans

  • El número de observaciones para cada marca de palomitas de maíz ( )coln

  • La estimación del rendimiento medio para cada tipo de popper ( )rowmeans

  • El número de observaciones para cada tipo de popper ( )rown

  • El número de interacciones ( )inter

  • Valor que muestra el nivel de significancia del término de interacción ( )ppval

  • Los grados de error de libertad ( ).df

Realizar una prueba de comparación múltiple para ver si el rendimiento de palomitas de maíz difiere entre pares de marcas de palomitas de maíz (columnas).

c = multcompare(stats)
Note: Your model includes an interaction term.  A test of main effects can be  difficult to interpret when the model includes interactions. 

c = 3×6

    1.0000    2.0000    0.9260    1.5000    2.0740    0.0000
    1.0000    3.0000    1.6760    2.2500    2.8240    0.0000
    2.0000    3.0000    0.1760    0.7500    1.3240    0.0116

Las dos primeras columnas muestran los grupos que se comparan.c La cuarta columna muestra la diferencia entre las medias de grupo estimadas. La tercera y quinta columnas muestran los límites inferior y superior para los intervalos de confianza del 95% para la diferencia media real. La sexta columna contiene el valor -value para una prueba de hipótesis de que la diferencia media correspondiente es igual a cero.p Todos los valores (0, 0 y 0.0116) son muy pequeños, lo que indica que el rendimiento de las palomitas de maíz difiere entre las tres marcas.p

La figura muestra la comparación múltiple de los medios. De forma predeterminada, la media del grupo 1 se resalta y el intervalo de comparación está en azul. Dado que los intervalos de comparación para los otros dos grupos no se intersecan con los intervalos para la media del grupo 1, se resaltan en rojo. Esta falta de intersección indica que ambos medios son diferentes de la media del grupo 1. Seleccione otros medios de grupo para confirmar que todos los medios de grupo son significativamente diferentes entre sí.

Realice una prueba de comparación múltiple para ver que el rendimiento de las palomitas de maíz difiere entre los dos tipos de popper (filas).

c = multcompare(stats,'Estimate','row')
Note: Your model includes an interaction term.  A test of main effects can be  difficult to interpret when the model includes interactions. 

c = 1×6

    1.0000    2.0000   -1.3828   -1.0000   -0.6172    0.0001

El pequeño valor de 0.0001 indica que el rendimiento de las palomitas de maíz difiere entre los dos tipos de popper (aire y aceite).p La figura muestra los mismos resultados. Los intervalos de comparación desarticulados indican que los medios del grupo son significativamente diferentes entre sí.

Cargue los datos de ejemplo.

y = [52.7 57.5 45.9 44.5 53.0 57.0 45.9 44.0]'; g1 = [1 2 1 2 1 2 1 2]; g2 = {'hi';'hi';'lo';'lo';'hi';'hi';'lo';'lo'}; g3 = {'may';'may';'may';'may';'june';'june';'june';'june'};

es el vector de respuesta y , , y son las variables de agrupación (factores).yg1g2g3 Cada factor tiene dos niveles, y cada observación se identifica mediante una combinación de niveles de factor.y Por ejemplo, la observación está asociada con el nivel 1 del factor, el nivel de factor y el nivel de factor .y(1)g1'hi'g2'may'g3 Del mismo modo, la observación se asocia con el nivel 2 del factor, el nivel de factor y el nivel de factor.y(6)g1'hi'g2'june'g3

Compruebe si la respuesta es la misma para todos los niveles de factor. También calcule las estadísticas necesarias para varias pruebas de comparación.

[~,~,stats] = anovan(y,{g1 g2 g3},'model','interaction',...     'varnames',{'g1','g2','g3'});

El valor -valor de 0.2578 indica que las respuestas medias para los niveles y de factor no son significativamente diferentes.p'may''june'g3 El valor -valor de 0.0347 indica que las respuestas medias para los niveles y de factor son significativamente diferentes.p12g1 Del mismo modo, el valor -de 0.0048 indica que las respuestas medias para los niveles y de factor son significativamente diferentes.p'hi''lo'g2

Realice varias pruebas de comparación para averiguar qué grupos de los factores y son significativamente diferentes.g1g2

results = multcompare(stats,'Dimension',[1 2])

results = 6×6

    1.0000    2.0000   -6.8604   -4.4000   -1.9396    0.0280
    1.0000    3.0000    4.4896    6.9500    9.4104    0.0177
    1.0000    4.0000    6.1396    8.6000   11.0604    0.0143
    2.0000    3.0000    8.8896   11.3500   13.8104    0.0108
    2.0000    4.0000   10.5396   13.0000   15.4604    0.0095
    3.0000    4.0000   -0.8104    1.6500    4.1104    0.0745

compara las combinaciones de grupos (niveles) de las dos variables de agrupación y .multcompareg1g2 En la matriz, el número 1 corresponde a la combinación de nivel y nivel de , el número 2 corresponde a la combinación de nivel y nivel de .results1g1hig22g1hig2 Del mismo modo, el número 3 corresponde a la combinación de nivel y nivel de , y el número 4 corresponde a la combinación de nivel y nivel de .1g1log22g1log2 La última columna de la matriz contiene los valores.p

Por ejemplo, la primera fila de la matriz muestra que la combinación de nivel y nivel de tiene los mismos valores de respuesta media que la combinación de nivel y nivel de .1g1hig22g1hig2 El valor correspondiente a esta prueba es 0.0280, lo que indica que las respuestas medias son significativamente diferentes.p También puede ver este resultado en la figura. La barra azul muestra el intervalo de comparación para la respuesta media para la combinación de nivel y nivel de .1g1hig2 Las barras rojas son los intervalos de comparación para la respuesta media para otras combinaciones de grupos. Ninguna de las barras rojas se superpone con la barra azul, lo que significa que la respuesta media para la combinación de nivel y nivel de es significativamente diferente de la respuesta media para otras combinaciones de grupos.1g1hig2

Puede probar los otros grupos haciendo clic en el intervalo de comparación correspondiente para el grupo. La barra en la que haces clic se convierte en azul. Las barras para los grupos que son significativamente diferentes son rojas. Las barras de los grupos que no son significativamente diferentes son grises. Por ejemplo, si hace clic en el intervalo de comparación para la combinación de nivel y nivel de , el intervalo de comparación para la combinación de nivel y nivel de superposiciones y, por lo tanto, es gris.1g1log22g1log2 Por el contrario, los otros intervalos de comparación son rojos, lo que indica una diferencia significativa.

Argumentos de entrada

contraer todo

Datos de prueba, especificados como una estructura. Puede crear una estructura utilizando una de las siguientes funciones:

  • — Análisis unidireccional de la varianza.anova1

  • — Análisis bidireccional de la varianza.anova2

  • — -análisis de vía de la varianza.anovanN

  • — Análisis interactivo de la herramienta de covarianza.aoctool

  • — Prueba de Friedman.friedman

  • — Prueba Kruskal-Wallis.kruskalwallis

no admite varias comparaciones mediante la salida para un modelo que incluye efectos aleatorios o anidados.multcompareanovan Los cálculos de un modelo de efectos aleatorios producen una advertencia de que todos los efectos se tratan como fijos. No se aceptan modelos anidados.

Tipos de datos: struct

Argumentos de par nombre-valor

Especifique pares opcionales separados por comas de argumentos. es el nombre del argumento y es el valor correspondiente. deben aparecer entre comillas.Name,ValueNameValueName Puede especificar varios argumentos de par de nombre y valor en cualquier orden como .Name1,Value1,...,NameN,ValueN

Ejemplo: calcula los valores críticos de Bonferroni, realiza las pruebas de hipótesis en el nivel de significancia del 1% y omite la pantalla interactiva.'Alpha',0.01,'CType','bonferroni','Display','off'

Nivel de significancia de la prueba de comparación múltiple, especificado como el par separado por comas que consta de y un valor escalar en el rango (0,1).'Alpha' El valor especificado para determina el'Alpha' 100 × (1 – α) niveles de confianza de los intervalos devueltos en la matriz y en la figura.c

Ejemplo: 'Alpha',0.01

Tipos de datos: single | double

Tipo de valor crítico que se usará para la comparación múltiple, especificado como el par separado por comas que consta de y uno de los siguientes.'CType'

Ejemplo: 'CType','bonferroni'

Mostrar alternancia, especificada como el par separado por comas que consta de y uno o .'Display''on''off' Si especifica , muestra un gráfico de las estimaciones y sus intervalos de comparación.'on'multcompare Si especifica , omita el gráfico.'off'multcompare

Ejemplo: 'Display','off'

Vector que especifica la dimensión o dimensiones sobre las que calcular las medias marginales de población, especificadas como un valor entero positivo, o un vector de dichos valores. Utilice el par nombre-valor solo si crea la estructura de entrada utilizando la función .'Dimension'statsanovan

Por ejemplo, si especifica como , a continuación, compara las medias para cada valor de la primera variable de agrupación, ajustada sin eliminar los efectos de las otras variables de agrupación como si el diseño estuviera equilibrado.'Dimension'1multcompare Si especifica como , calcula las medias marginales de población para cada combinación de la primera y tercera variables de agrupación, eliminando los efectos de la segunda variable de agrupación.'Dimension'[1,3]multcompare Si se ajusta a un modelo singular, algunos medios de celda pueden no ser estimables y cualquier media marginal de población que dependen de esos medios de celda tendrá el valor .NaN

Los medios marginales de población son descritos por Milliken y Johnson (1992) y por Searle, Speed y Milliken (1980). La idea detrás de los medios marginales de población es eliminar cualquier efecto de un diseño desequilibrado fijando los valores de los factores especificados por , y promediando los efectos de otros factores como si cada combinación de factores ocurriera el mismo número de veces.'Dimension' La definición de medios marginales de población no depende del número de observaciones en cada combinación de factores. Para experimentos diseñados en los que el número de observaciones en cada combinación de factores no tiene sentido, los medios marginales de población pueden ser más fáciles de interpretar que los medios simples ignorando otros factores. Para las encuestas y otros estudios en los que el número de observaciones en cada combinación tiene sentido, los medios marginales de la población pueden ser más difíciles de interpretar.

Ejemplo: 'Dimension',[1,3]

Tipos de datos: single | double

Estimaciones que se van a comparar, especificadas como el par separado por comas que consta de un valor permitido.'Estimate' Los valores permitidos para dependen de la función utilizada para generar la estructura de entrada, según la tabla siguiente.'Estimate'stats

FuenteValores
anova1

Ninguno. Este par nombre-valor se omite y siempre compara los medios de grupo.multcompare

anova2

Para comparar las medias de columna o para comparar las medias de fila.'column''row'

anovan

Ninguno. Este par nombre-valor se omite y siempre compara las medias marginales de población especificadas por el argumento de par nombre-valor.multcompare'Dimension'

aoctool

O bien , , o para comparar pendientes, interceptaciones o medios marginales de población, respectivamente.'slope''intercept''pmm' Si el análisis del modelo de covarianza no incluyó taludes separados, no se permite.'slope' Si no incluyó interceptaciones separadas, entonces no hay comparaciones posibles.

friedman

Ninguno. Este par nombre-valor se omite y siempre compara los rangos medios de columna.multcompare

kruskalwallis

Ninguno. Este par nombre-valor se omite y siempre compara las filas medias del grupo.multcompare

Ejemplo: 'Estimate','row'

Argumentos de salida

contraer todo

Matriz de múltiples resultados de comparación, devuelta como una matriz -by-6 de valores escalares, donde está el número de pares de grupos.pp Cada fila de la matriz contiene el resultado de una prueba de comparación emparejada. Las columnas 1 y 2 contienen los índices de las dos muestras que se comparan. La columna 3 contiene el intervalo de confianza inferior, la columna 4 contiene la estimación y la columna 5 contiene el intervalo de confianza superior. La columna 6 contiene el valor -value para la prueba de hipótesis de que la diferencia media correspondiente no es igual a 0.p

Por ejemplo, supongamos que una fila contiene las siguientes entradas.

2.0000  5.0000  1.9442  8.2206  14.4971 0.0432

Estos números indican que la media del grupo 2 menos la media del grupo 5 se estima en 8.2206, y un intervalo de confianza del 95% para la diferencia real de los medios es [1.9442, 14.4971]. El valor -valor para la prueba de hipótesis correspondiente que la diferencia de los medios de los grupos 2 y 5 es significativamente diferente de cero es 0.0432.p

En este ejemplo el intervalo de confianza no contiene 0, por lo que la diferencia es significativa en el nivel de significancia del 5%. Si el intervalo de confianza contuviera 0, la diferencia no sería significativa. El valor -valor de 0.0432 también indica que la diferencia de los medios de los grupos 2 y 5 es significativamente diferente de 0.p

Matriz de las estimaciones, devuelta como una matriz de valores escalares. La primera columna de contiene los valores estimados de los medios (o cualquier estadística que se esté comparando) para cada grupo, y la segunda columna contiene sus errores estándar.m

Controlar la figura que contiene el gráfico interactivo, devuelto como identificador. El título de este gráfico contiene instrucciones para interactuar con el gráfico, y la etiqueta -axis contiene información sobre qué medios son significativamente diferentes de la media seleccionada.x Si planea utilizar este gráfico para la presentación, es posible que desee omitir el título y la etiqueta -eje.x Puede eliminarlos mediante las funciones interactivas de la ventana del gráfico, o puede utilizar los siguientes comandos.

title('') xlabel('')

Nombres de grupo, devueltos como una matriz de celdas de vectores de caracteres. Cada fila de contiene el nombre de un grupo.gnames

Más acerca de

contraer todo

Pruebas de comparación múltiples

El análisis de la varianza compara los medios de varios grupos para probar la hipótesis de que todos son iguales, con la alternativa general de que no todos son iguales. A veces esta alternativa puede ser demasiado general. Es posible que necesite información sobre qué pares de medios son significativamente diferentes y cuáles no. A puede proporcionar esta información.prueba de comparación múltiple

Cuando se realiza una prueba simple de una media de grupo frente a otra, se especifica un nivel de significancia que determina el valor de corte de la estadística.tt Por ejemplo, puede especificar el valor para asegurarse de que cuando no hay ninguna diferencia real, encontrará incorrectamente una diferencia significativa no más del 5% del tiempo.alpha0.05 Cuando hay muchos medios de grupo, también hay muchos pares para comparar. Si aplicó una prueba ordinaria en esta situación, el valor se aplicaría a cada comparación, por lo que la posibilidad de encontrar incorrectamente una diferencia significativa aumentaría con el número de comparaciones.talpha Múltiples procedimientos de comparación están diseñados para proporcionar un límite superior en la probabilidad de que la comparación se encuentre incorrectamente significativa.Cualquier

Referencias

[1] Hochberg, Y., and A. C. Tamhane. Multiple Comparison Procedures. Hoboken, NJ: John Wiley & Sons, 1987.

[2] Milliken, G. A., and D. E. Johnson. Analysis of Messy Data, Volume I: Designed Experiments. Boca Raton, FL: Chapman & Hall/CRC Press, 1992.

[3] Searle, S. R., F. M. Speed, and G. A. Milliken. “Population marginal means in the linear model: an alternative to least-squares means.” American Statistician. 1980, pp. 216–221.

Consulte también

| | | | |

Introducido antes de R2006a