Esta página aún no se ha traducido para esta versión. Puede ver la versión más reciente de esta página en inglés.

Visualización de Tall arrays

La visualización de grandes conjuntos de datos requiere que los datos estén resumidos, en carpetas o muestreados de alguna manera para reducir el número de puntos que se trazan en la pantalla. En algunos casos, funciones tales como y bin los datos para reducir el tamaño, mientras que otras funciones como y utilizar un enfoque más complejo que evita el trazado de píxeles duplicados en la pantalla.histogrampieplotscatter Para los problemas en los que la superposición de píxeles es relevante para el análisis, la función también ofrece una forma eficaz de visualizar los patrones de densidad.binscatter

La visualización de matrices altas requiere el uso de. evalúa inmediatamente y muestra visualizaciones de matrices altas.notgatherMATLAB® Actualmente, puede visualizar matrices altas utilizando las funciones y métodos de esta tabla.

FunciónCajas de herramientas requeridasNotas
plot

Estas funciones trazan en iteraciones, añadiendo progresivamente a la gráfica a medida que se leen más datos. Durante las actualizaciones, un indicador de progreso muestra la proporción de datos que se han trazado. El zoom y la panorámica se admiten durante el proceso de actualización, antes de que finalice el trazado. Para detener el proceso de actualización, pulse el botón de pausa en el indicador de progreso.

scatter
binscatter
histogram 
histogram2 
pie

Para visualizar únicamente datos categóricos.

binScatterPlot Statistics and Machine Learning Toolbox™

Figura contiene un control deslizante para controlar el brillo y el detalle de color en la imagen. El control deslizante ajusta el valor del parámetro de corrección de imagen.Gamma

ksdensity Statistics and Machine Learning Toolbox

Produce una estimación de densidad de probabilidad para los datos, evaluada en 100 puntos para datos univariados, o 900 puntos para datos bivariados.

datasample Statistics and Machine Learning Toolbox

le permite extraer una submuestra de una matriz alta de una manera estadísticamente sonora en comparación con la indexación simple.datasample Si el subconjunto de datos es lo suficientemente pequeño como para caber en la memoria, puede usar las funciones de trazado y ajuste en el subconjunto que no admiten directamente matrices altas.

Ejemplos de trazado Tall array

Este ejemplo muestra varias formas diferentes en las que puede visualizar matrices altas.

Cree un datastore para el conjunto de datos, que contiene filas de datos de vuelo de la aerolínea.airlinesmall.csv Seleccione un subconjunto de las variables de tabla con las que trabajar y quite las filas que contengan valores faltantes.

ds = datastore('airlinesmall.csv','TreatAsMissing','NA'); ds.SelectedVariableNames = {'Year','Month','ArrDelay','DepDelay','Origin','Dest'}; T = tall(ds); T = rmmissing(T)
T =    Mx6 tall table      Year    Month    ArrDelay    DepDelay    Origin    Dest      ____    _____    ________    ________    ______    _____      1987     10          8          12       'LAX'     'SJC'     1987     10          8           1       'SJC'     'BUR'     1987     10         21          20       'SAN'     'SMF'     1987     10         13          12       'BUR'     'SJC'     1987     10          4          -1       'SMF'     'LAX'     1987     10         59          63       'LAX'     'SJC'     1987     10          3          -2       'SAN'     'SFO'     1987     10         11          -1       'SEA'     'LAX'      :        :         :           :          :         :      :        :         :           :          :         : 

Gráfico circular de vuelos por mes

Convierta la variable numérica en una variable categórica que refleje el nombre del mes.Month A continuación, trace un gráfico circular que muestre cuántos vuelos hay en los datos de cada mes del año.

T.Month = categorical(T.Month,1:12,{'Jan','Feb','Mar','Apr','May','Jun','Jul','Aug','Sep','Oct','Nov','Dec'})
T =    Mx6 tall table      Year    Month    ArrDelay    DepDelay    Origin    Dest      ____    _____    ________    ________    ______    _____      1987     Oct         8          12       'LAX'     'SJC'     1987     Oct         8           1       'SJC'     'BUR'     1987     Oct        21          20       'SAN'     'SMF'     1987     Oct        13          12       'BUR'     'SJC'     1987     Oct         4          -1       'SMF'     'LAX'     1987     Oct        59          63       'LAX'     'SJC'     1987     Oct         3          -2       'SAN'     'SFO'     1987     Oct        11          -1       'SEA'     'LAX'      :        :         :           :          :         :      :        :         :           :          :         : 
pie(T.Month)
Evaluating tall expression using the Local MATLAB Session: - Pass 1 of 2: Completed in 1.6 sec - Pass 2 of 2: Completed in 1.2 sec Evaluation completed in 3.4 sec 

Histograma de retrasos

Trace un histograma de los retrasos de llegada para cada vuelo en los datos. Puesto que los datos tienen una cola larga, limite el área de trazado utilizando el par nombre-valor.BinLimits

histogram(T.ArrDelay,'BinLimits',[-50 150])
Evaluating tall expression using the Local MATLAB Session: - Pass 1 of 2: Completed in 3.1 sec - Pass 2 of 2: Completed in 1.2 sec Evaluation completed in 5.1 sec 

Gráfico de dispersión de retrasos

Trazar un diagrama de dispersión de los retrasos de llegada y salida. Usted puede esperar una fuerte correlación entre estas variables ya que los vuelos que salen tarde también es probable que lleguen tarde.

Cuando se operan en matrices altas, las funciones y, a su vez, trazan los datos en iteraciones, añadiendo progresivamente al trazado a medida que se leen más datos.plotscatterbinscatter Durante las actualizaciones, la parte superior de la gráfica tiene un indicador de progreso que muestra la cantidad de datos que se han trazado. El zoom y la panorámica se admiten durante las actualizaciones antes de que finalice el trazado.

scatter(T.ArrDelay,T.DepDelay) xlabel('Arrival Delay') ylabel('Departure Delay') xlim([-140 1000]) ylim([-140 1000])

La barra de progreso también incluye un botón.Pause/Resume Utilice el botón para detener las actualizaciones de trazado antes de que se muestren los datos suficientes.

Ajustar línea de tendencia

Utilice las funciones y para superponer una línea de tendencia lineal en la parcela de retrasos de llegada y salida.polyfitpolyval

hold on p = polyfit(T.ArrDelay,T.DepDelay,1); x = sort(T.ArrDelay,1); yp = polyval(p,x); plot(x,yp,'r-') hold off

Visualice la densidad

El gráfico de dispersión de puntos es útil hasta cierto punto, pero puede ser difícil descifrar la información de la gráfica si los puntos se superponen ampliamente. En ese caso, ayuda a visualizar la densidad de puntos en la trama para detectar tendencias.

Utilice la función para visualizar la densidad de puntos en la trama de retrasos de llegada y salida.binscatter

binscatter(T.ArrDelay,T.DepDelay,'XLimits',[-100 1000],'YLimits',[-100 1000]) xlim([-100 1000]) ylim([-100 1000]) xlabel('Arrival Delay') ylabel('Departure Delay')

Ajuste la propiedad de los ejes para que todos los valores de bin superiores a 150 se colorean de la misma manera.CLim Esto evita que unos cuantos bins con valores muy grandes dominen la trama.

ax = gca; ax.CLim = [0 150];

Consulte también

| |

Temas relacionados