Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

boxplot

Descripción

ejemplo

boxplot(x) crea un trazado de caja de los datos en .x Si es un vector, traza un cuadro.xboxplot Si es una matriz, traza un cuadro para cada columna de .xboxplotx

En cada cuadro, la marca central indica la mediana, y los bordes inferior y superior del cuadro indican los percentiles 25 y 75, respectivamente. Los bigotes se extienden a los puntos de datos más extremos que no se consideran valores atípicos, y los valores atípicos se trazan individualmente utilizando el símbolo.'+'

ejemplo

boxplot(x,g) crea un trazado de caja utilizando una o más variables de agrupación contenidas en . genera un cuadro independiente para cada conjunto de valores que comparten el mismo valor o valores.gboxplotxg

boxplot(ax,___) crea un trazado de cuadro utilizando los ejes especificados por el objeto gráfico de ejes, utilizando cualquiera de las sintaxis anteriores.ax

ejemplo

boxplot(___,Name,Value) crea un diagrama de cuadro con opciones adicionales especificadas por uno o más argumentos de par.Name,Value Por ejemplo, puede especificar el estilo u orden del cuadro.

Ejemplos

contraer todo

Cargue los datos de ejemplo.

load carsmall

Cree una gráfica de caja de las medidas de millas por galón ( ).MPG Agregue un título y etiquete los ejes.

boxplot(MPG) xlabel('All Vehicles') ylabel('Miles per Gallon (MPG)') title('Miles per Gallon for All Vehicles')

La gráfica de caja muestra que la mediana de millas por galón para todos los vehículos en los datos de muestra es aproximadamente 24. El valor mínimo es aproximadamente 9, y el valor máximo es aproximadamente 44.

Cargue los datos de ejemplo.

load carsmall

Cree una gráfica de caja de las medidas de millas por galón ( ) a partir de los datos de la muestra, agrupadas por el país de origen de los vehículos ( ).MPGOrigin Agregue un título y etiquete los ejes.

boxplot(MPG,Origin) title('Miles per Gallon by Vehicle Origin') xlabel('Country of Origin') ylabel('Miles per Gallon (MPG)')

Cada cuadro representa visualmente los datos MPG de los automóviles del país especificado. La "caja" de Italia aparece como una sola línea porque los datos de muestra contienen una sola observación para este grupo.

Genere dos conjuntos de datos de ejemplo. La primera muestra, , contiene números aleatorios generados a partir de una distribución normal con y .x1mu = 5sigma = 1 La segunda muestra, , contiene números aleatorios generados a partir de una distribución normal con y .x2mu = 6sigma = 1

rng default  % For reproducibility x1 = normrnd(5,1,100,1); x2 = normrnd(6,1,100,1);

Cree trazados de cuadro con muescas de y .x1x2 Etiquete cada cuadro con su valor correspondiente.mu

figure boxplot([x1,x2],'Notch','on','Labels',{'mu = 5','mu = 6'}) title('Compare Random Data from Different Distributions')

La gráfica de caja muestra que la diferencia entre las medianas de los dos grupos es aproximadamente 1. Dado que las muescas en la gráfica de caja no se superponen, puede concluir, con un 95% de confianza, que las medias reales difieren.

La figura siguiente muestra la gráfica de caja para los mismos datos con la longitud máxima del bigote especificada como 1,0 veces el intervalo intercuartil. Los puntos de datos más allá de los bigotes se muestran utilizando .+

figure boxplot([x1,x2],'Notch','on','Labels',{'mu = 5','mu = 6'},'Whisker',1) title('Compare Random Data from Different Distributions')

Con los bigotes más pequeños, muestra más puntos de datos como valores atípicos.boxplot

Cree una matriz de 100 por 25 de números aleatorios generados a partir de una distribución normal estándar para utilizarlos como datos de muestra.

rng default  % For reproducibility x = randn(100,25);

Cree dos trazados de cuadro para los datos en la misma figura.x Utilice el formato predeterminado para el trazado superior y el formato compacto para el trazado inferior.

figure  subplot(2,1,1) boxplot(x)  subplot(2,1,2) boxplot(x,'PlotStyle','compact')

Cada trazado presenta los mismos datos, pero el formato compacto puede mejorar la legibilidad de los trazados con muchos cuadros.

Cree trazados de cuadro para vectores de datos de longitud variable mediante una variable de agrupación.

Genere aleatoriamente tres vectores de columna de longitud variable: uno de longitud, uno de longitud y otro de longitud.51015 Combine los datos en un vector de una sola columna de longitud.30

rng('default')  % For reproducibility x1 = rand(5,1); x2 = rand(10,1); x3 = rand(15,1); x = [x1; x2; x3];

Cree una variable de agrupación que asigne el mismo valor a las filas que corresponden al mismo vector en .x Por ejemplo, las primeras cinco filas de tienen el mismo valor, , porque las primeras cinco filas de todas proceden del mismo vector, .gFirstxx1

g1 = repmat({'First'},5,1); g2 = repmat({'Second'},10,1); g3 = repmat({'Third'},15,1); g = [g1; g2; g3];

Cree los trazados de cuadro.

boxplot(x,g)

Argumentos de entrada

contraer todo

Datos de entrada, especificados como un vector numérico o una matriz numérica. Si es un vector, traza un cuadro.xboxplot Si es una matriz, traza un cuadro para cada columna de .xboxplotx

En cada cuadro, la marca central indica la mediana, y los bordes inferior y superior del cuadro indican los percentiles 25 y 75, respectivamente. Los bigotes se extienden a los puntos de datos más extremos que no se consideran valores atípicos, y los valores atípicos se trazan individualmente utilizando el símbolo.'+'

Tipos de datos: single | double

Variables de agrupación, especificadas como un vector numérico, matriz de caracteres, matriz de cadenas, matriz de celdas o matriz categórica. Puede especificar varias variables de agrupación mediante una matriz de celdas de estos tipos de variables o una matriz.g Si especifica varias variables de agrupación, todas deben tener la misma longitud.

Si es un vector, las variables de agrupación deben contener una fila para cada elemento de .xx Si es una matriz, las variables de agrupación deben contener una fila para cada columna de .xx Se omiten los grupos que contienen un valor que falta ( ), un vector de caracteres vacío, un vacío o una cadena o un valor en una variable de agrupación y no se cuentan en el número de grupos considerados por otros parámetros.NaN<missing><undefined>

De forma predeterminada, ordena las variables de agrupación de caracteres y cadenas en el orden en que aparecen inicialmente en los datos, las variables de agrupación categóricas por el orden de sus niveles y las variables de agrupación numérica en orden numérico.boxplot Para controlar el orden de los grupos, realice una de las siguientes acciones:

  • Utilice variables categóricas y especifique el orden de sus niveles.g

  • Utilice el argumento par nombre-valor.'GroupOrder'

  • Pre-ordene sus datos.

Tipos de datos: single | double | char | string | cell | categorical

Ejes en los que se va a trazar, especificados como un objeto gráfico de ejes. Si no especifica , crea el trazado utilizando el eje actual.axboxplot Para obtener más información sobre la creación de un objeto gráfico de ejes, consulte y .axesAxes Properties

Argumentos de par nombre-valor

Especifique pares opcionales separados por comas de argumentos. es el nombre del argumento y es el valor correspondiente. deben aparecer entre comillas.Name,ValueNameValueName Puede especificar varios argumentos de par de nombre y valor en cualquier orden como .Name1,Value1,...,NameN,ValueN

Ejemplo: crea una gráfica de caja con muescas y etiqueta las dos cajas y, de izquierda a derecha'Notch','on','Labels',{'mu = 5','mu = 6'}mu = 5mu = 6
Apariencia de caja

contraer todo

Estilo de cuadro, especificado como el par separado por comas que consta de y uno de los siguientes.'BoxStyle'

NombreValor
'outline'Traza cajas usando una caja sin rellenar con bigotes discontinuos. Este es el valor predeterminado si es .'PlotStyle''traditional'
'filled'Trazar cajas usando una caja llena estrecha con líneas para bigotes. Este es el valor predeterminado si es .'PlotStyle''compact'

Ejemplo: 'BoxStyle','filled'

Colores de cuadro, especificados como el par separado por comas que consta de un triplete RGB, un vector de caracteres o un escalar de cadena.'Colors' Un triplete RGB es un vector de fila de tres elementos cuyos elementos especifican las intensidades de los componentes rojo, verde y azul del color, respectivamente. Cada intensidad debe estar en el rango [0,1].

En la tabla siguiente se enumeran los caracteres de color disponibles y sus valores de triplete RGB equivalentes.

Nombre largoNombre cortoTriplete RGB
Amarillo'y'[1 1 0]
Magenta'm'[1 0 1]
Cian'c'[0 1 1]
Rojo'r'[1 0 0]
Verde'g'[0 1 0]
Azul'b'[0 0 1]
Blanco'w'[1 1 1]
Negro'k'[0 0 0]

Puede especificar varios colores como vector de caracteres o escalar de cadena de nombres de color (por ejemplo, ) o una matriz de tres columnas de valores RGB.'rgbm' La secuencia se replica o trunca según sea necesario, por lo que, por ejemplo, proporciona cuadros que alternan rojo y azul.'rb'

Si no especifica el par nombre-valor , utilice el mismo esquema de color para todos los cuadros.'ColorGroup'boxplot Si especifica , el valor predeterminado es un archivo .'ColorGroup'hsvcolormap

Ejemplo: 'Colors','rgbm'

Estilo mediano, especificado como el par separado por comas que consta de y uno de los siguientes.'MedianStyle'

NombreValor
'line'Dibuje una línea para representar la mediana en cada cuadro. Este es el valor predeterminado cuando es .'PlotStyle''traditional'
'target'Dibuje un punto negro dentro de un círculo blanco para representar la mediana en cada cuadro. Este es el valor predeterminado cuando es .'PlotStyle''compact'

Ejemplo: 'MedianStyle','target'

Marcador para intervalos de comparación, especificado como el par separado por comas que consta de y uno de los siguientes.'Notch'

NombreValor
'off'Omita los intervalos de comparación de la visualización del cuadro.
'on'Si es , dibuje intervalos de comparación utilizando muescas.'PlotStyle''traditional' Si es , dibuje intervalos de comparación utilizando marcadores triangulares.'PlotStyle''compact'
'marker'Dibuje intervalos de comparación utilizando marcadores triangulares.

Dos medianas son significativamente diferentes en el nivel de significancia del 5% si sus intervalos no se superponen. representa los puntos finales de intervalo utilizando los extremos de las muescas o los centros de los marcadores triangulares.boxplot Los extremos de muesca corresponden a q2 – 1.57(q3q1)/sqrt(n) Y q2 + 1.57(q3q1)/sqrt(n)Dónde q2 es la mediana (percentil 50), q1 Y q3 son los percentiles 25 y 75, respectivamente, y es el número de observaciones sin ningún valor.nNaN Si el tamaño de la muestra es pequeño, las muescas pueden extenderse más allá del final de la caja.

Ejemplo: 'Notch','on'

Tamaño del marcador para valores atípicos, especificado como el par separado por comas que consta de y un valor numérico positivo.'OutlierSize' El valor especificado representa el tamaño del marcador en puntos.

Si es , entonces el valor predeterminado para es 6.'PlotStyle''traditional'OutlierSize Si es , entonces el valor predeterminado para es 4.'PlotStyle''compact'OutlierSize

Ejemplo: 'OutlierSize',8

Tipos de datos: single | double

Estilo de trazado, especificado como el par separado por comas que consta de y uno de los siguientes.'PlotStyle'

NombreValor
'traditional'Trazar cajas utilizando un estilo de caja tradicional.
'compact'Cuadros de trazado utilizando un estilo de caja más pequeño diseñado para trazados con muchos grupos. Este estilo cambia los valores predeterminados de algunos otros parámetros.

Ejemplo: 'PlotStyle','compact'

Símbolo y color para valores atípicos, especificados como el par separado por comas que consta de y una especificación de línea.'Symbol' Consulte el parámetro en las especificaciones de línea disponibles.LineSpecplot

Si es , entonces el valor predeterminado es , que traza cada valor atípico utilizando un símbolo rojo.'PlotStyle''traditional''r+''+'

Si es , entonces el valor predeterminado es , que traza cada valor atípico utilizando un símbolo en el mismo color que el cuadro correspondiente.'PlotStyle''compact''o''o'

Si omite el símbolo, los valores atípicos aparecen invisibles. Si omite el color, los valores atípicos aparecen en el mismo color que el cuadro.

Ejemplo: 'kx'

Ancho de cuadro, especificado como el par separado por comas que consta de un vector escalar o numérico numérico.'Widths' Si el número de cuadros no es igual al número de valores de ancho especificados, la lista de valores se replica o trunca según sea necesario.

Este argumento de par nombre-valor no altera el espaciado entre cuadros. Por lo tanto, si especifica un valor grande para , los cuadros podrían superponerse.'Widths'

El ancho del cuadro predeterminado es igual a la mitad de la separación mínima entre cuadros, que es 0,5 cuando el argumento de par nombre-valor toma su valor predeterminado.'Positions'

Ejemplo: 'Widths',0.3

Tipos de datos: single | double

Apariencia de grupo

contraer todo

Variable de agrupación para el cambio de color del cuadro, especificada como el par separado por comas que consta de una variable de agrupación y una.'ColorGroup' La variable de agrupación es un vector numérico, matriz de caracteres, matriz de cadenas, matriz de celdas o matriz categórica. El color del cuadro cambia cuando cambia la variable de agrupación especificada. El valor predeterminado indica que el color del cuadro no cambia en función del grupo.[]

Tipos de datos: single | double | char | string | cell | categorical

Orden de factores en el trazado, especificado como el par separado por comas que consta de y uno de los siguientes.'FactorDirection'

NombreValor
'data'Los factores aparecen con el primer valor junto al origen del trazado.
'list'Los factores aparecen de izquierda a derecha si están en el eje X, o de arriba a abajo si están en el eje Y.
'auto'Si las variables de agrupación son numéricas, utiliza .boxplot'data' Si las variables de agrupación son matrices de caracteres, matrices de cadenas, matrices de celdas o matrices categóricas, utiliza .boxplot'list'

Trazar todos los factores de grupo, especificados como el par separado por comas que consta de y uno o .'FullFactors''off''on' Si , traza un cuadro para cada fila única de variables de agrupación.'off'boxplot Si , traza un cuadro para cada posible combinación de valores de variables de agrupación, incluidas las combinaciones que no aparecen en los datos.'on'boxplot

Ejemplo: 'FullFactors','on'

Distancia entre diferentes factores de agrupación, especificado como el par separado por comas que consta de y un valor numérico positivo, un vector de valores numéricos positivos o .'FactorGap''auto' Si especifica un vector, la longitud del vector debe ser menor o igual que el número de variables de agrupación.

representa la distancia de la separación entre diferentes factores de una variable de agrupación, expresada como un porcentaje de la anchura del trazado.'FactorGap' Por ejemplo, si especifica , el intervalo es el tres por ciento del ancho del trazado entre grupos con valores diferentes de la primera variable de agrupación y un porcentaje entre grupos con el mismo valor de la primera variable de agrupación pero valores diferentes para el segundo.[3,1]

Si especifica , seleccione automáticamente una distancia de separación.'auto'boxplot El valor indica que no hay ningún cambio en el tamaño de la brecha entre diferentes factores.[]

Si es , entonces el valor predeterminado para es .'PlotStyle''traditional'FactorGap[] Si es , entonces el valor predeterminado es .'PlotStyle''compact''auto'

Ejemplo: 'FactorGap',[3,1]

Tipos de datos: single | double | char | string

Separación entre factores de agrupación, especificado como el par separado por comas que consta de un entero positivo o un vector de enteros positivos, o .'FactorSeparator''auto' Si especifica un vector, la longitud del vector debe ser menor o igual que el número de variables de agrupación. Los valores enteros deben estar en el intervalo [1, ], donde está el número de variables de agrupación.GG

especifica qué factores deben tener sus valores separados por una línea de cuadrícula.'FactorSeparator' Por ejemplo, agrega una línea separadora cuando la primera o segunda variable de agrupación cambia de valor.[1,2]

Si es , entonces el valor predeterminado para es .'PlotStyle''traditional'FactorSeparator[] Si es , entonces el valor predeterminado es .'PlotStyle''compact''auto'

Ejemplo: 'FactorSeparator',[1,2]

Tipos de datos: single | double | char | string

Orden de trazado de grupos, especificado como el par separado por comas que consta de y una matriz de cadenas o matriz de celdas que contiene los nombres de las variables de agrupación.'GroupOrder' Si tiene varias variables de agrupación, separe los valores con una coma. También puede utilizar matrices categóricas como variables de agrupación para controlar el orden de los cuadros. El valor predeterminado no reordena los cuadros.[]

Tipos de datos: string | cell

Límites de datos y distancias máximas

contraer todo

Límites de datos extremos, especificados como el par separado por comas que consta de un vector numérico de dos elementos que contiene los límites inferior y superior, respectivamente.'DataLim' Los valores especificados se utilizan para determinar qué puntos de datos son extremos.'DataLim''ExtremeMode'

Tipos de datos: single | double

Método de manipulación de datos extremos, especificado como el par separado por comas que consta de y uno de los siguientes.'ExtremeMode'

NombreValor
'clip'Si los valores de datos están fuera de los límites especificados por , muestra estos valores en el trazado.'DataLim'boxplotDataLim
'compress'Si los valores de datos están fuera de los límites especificados por , muestra estos valores distribuidos uniformemente en una región justo fuera, conservando el orden relativo de los puntos.'DataLim'boxplotDataLim

Si algún punto de datos se encuentra fuera del límite especificado por , el límite se marca con una línea de puntos.'DataLim' Si se comprimen puntos de datos, dos líneas grises marcan la región de compresión. Los valores en o se pueden recortar o comprimir, pero los valores no aparecen en el trazado.–InfInfNaN Las muescas de cuadro se dibujan a escala y pueden extenderse más allá de los límites si la mediana está dentro del límite. Las muescas de caja no se dibujan si la mediana está fuera de los límites.

Ejemplo: 'ExtremeMode','compress'

Distancia de desplazamiento atípico máxima, especificada como el par separado por comas que consta de y un valor numérico. es la distancia máxima para desplazar los valores atípicos a lo largo del eje del factor por una cantidad aleatoria uniforme, con el fin de hacer visibles los puntos duplicados.'Jitter'Jitter Si especifica igual a 1, las regiones de fluctuación solo se tocan entre los grupos adyacentes más cercanos.'Jitter'

Si es , entonces el valor predeterminado para es 0.'PlotStyle''traditional'Jitter Si es , entonces el valor predeterminado es 0.5.'PlotStyle''compact'

Ejemplo: 'Jitter',1

Tipos de datos: single | double

Longitud máxima del bigote, especificada como el par separado por comas que consta de y un valor numérico positivo.'Whisker'

dibuja puntos como valores atípicos si son mayores queboxplot q3 + w × (q3q1) o menos de q1w × (q3q1), donde está la longitud máxima del bigote, ywq1 Yq3 son los percentiles 25 y 75 de los datos de la muestra, respectivamente.

El valor predeterminado para corresponde aproximadamente a'Whisker' +/–2.7σ y una cobertura del 99,3 por ciento si los datos se distribuyen normalmente. El bigote trazado se extiende al , que es el valor de datos más extremo que no es un valor atípico.valor adyacente

Especifique como 0 para no dar bigotes y para hacer cada punto fuera de'Whisker'q1 Yq3 un atípico.

Ejemplo: 'Whisker',0

Tipos de datos: single | double

Apariencia de la gráfica

contraer todo

Etiquetas de cuadro, especificadas como el par separado por comas que consta de y una matriz de caracteres, matriz de cadenas, matriz de celdas o vector numérico que contiene los nombres de etiqueta de cuadro.'Labels' Especifique una etiqueta por valor o una etiqueta por grupo.x Para especificar varias variables de etiqueta, utilice una matriz numérica o una matriz de celdas que contenga cualquiera de los tipos de datos aceptados.

Para eliminar etiquetas de un trazado, utilice el siguiente comando: .set(gca,'XTickLabel',{' '})

Tipos de datos: char | string | cell | single | double

Orientación de la etiqueta, especificada como el par separado por comas que consta de y uno de los siguientes.'LabelOrientation'

NombreValor
'inline'Gire las etiquetas de caja para que sean verticales. Este es el valor predeterminado cuando es .'PlotStyle''compact'
'horizontal'Deje las etiquetas de caja horizontales. Este es el valor predeterminado cuando es .'PlotStyle''traditional'

Si las etiquetas están en el eje, ambos ajustes dejan las etiquetas horizontales.y

Ejemplo: 'LabelOrientation','inline'

Etiquetas que se mostrarán en el trazado, especificadas como el par separado por comas que consta de LabelVerbosity y uno de los siguientes.

NombreValor
'all'Muestre una etiqueta para cada factor. Este es el valor predeterminado cuando es .'PlotStyle''traditional'
'minor'Mostrar una etiqueta para un factor solo cuando ese factor tiene un valor diferente al del grupo anterior.
'majorminor'Mostrar una etiqueta para un factor cuando ese factor o cualquier factor importante tiene un valor diferente del grupo anterior. Este es el valor predeterminado cuando es .'PlotStyle''compact'

Ejemplo: 'LabelVerbosity','minor'

Orientación de trazado, especificada como el par separado por comas que consta de Orientación y uno de los siguientes.

NombreValor
'vertical'Trazar en el eje.xy
'horizontal'Trazar en el eje.xx

Ejemplo: 'horizontal'

Posiciones de cuadro, especificadas como el par separado por comas que consta de y un vector numérico que contiene una entrada para cada grupo o valor.'Positions'x El valor predeterminado es 1: , donde está el número de grupos.NumGroupsNumGroups

Tipos de datos: single | double

Sugerencias

  • crea una representación visual de los datos, pero no devuelve valores numéricos.boxplot Para calcular las estadísticas de resumen relevantes para los datos de muestra, utilice las funciones siguientes:

    • — Busque el valor mínimo en los datos de muestra.min

    • — Buscar el valor máximo en los datos de la muestra.max

    • — Busque el valor medio en los datos de muestra.median

    • — Busque los valores cuantitativos en los datos de muestra.quantile

    • — Calcular estadísticas de resumen para los datos de muestra, organizados por grupo.grpstats

  • Puede ver los valores de datos y los nombres de grupo mediante la ventana de figura.cursor de datos El cursor muestra los valores originales de los puntos afectados por el parámetro.datalim Puede etiquetar el grupo al que pertenece un atípico utilizando la función.gname

  • Para modificar las propiedades de gráficos de un componente de trazado de cuadro, utilice con la propiedad para buscar el identificador del componente. Los valores de los componentes de trazado de cuadro dependen de la configuración de parámetros y se enumeran en la tabla siguiente.findobjTagTag

    Configuración de parámetrosValores de etiqueta
    Todos los ajustes
    • 'Box'

    • 'Outliers'

    ¿Cuándo se'PlotStyle''traditional'
    • 'Median'

    • 'Upper Whisker'

    • 'Lower Whisker'

    • 'Upper Adjacent Value'

    • 'Lower Adjacent Value'

    ¿Cuándo se'PlotStyle''compact'
    • 'Whisker'

    • 'MedianOuter'

    • 'MedianInner'

    ¿Cuándo se'Notch''marker'
    • 'NotchLo'

    • 'NotchHi'

Referencias

[1] McGill, R., J. W. Tukey, and W. A. Larsen. “Variations of Boxplots.” The American Statistician. Vol. 32, No. 1, 1978, pp. 12–16.

[2] Velleman, P.F., and D.C. Hoaglin. Applications, Basics, and Computing of Exploratory Data Analysis. Pacific Grove, CA: Duxbury Press, 1981.

[3] Nelson, L. S. “Evaluating Overlapping Confidence Intervals.” Journal of Quality Technology. Vol. 21, 1989, pp. 140–141.

[4] Langford, E. “Quartiles in Elementary Statistics”, Journal of Statistics Education. Vol. 14, No. 3, 2006.

Introducido antes de R2006a