dataset Clase
(No recomendado) Arreglos para datos estadísticos
El tipo de datos dataset
no se recomienda. Para trabajar con datos heterogéneos, utilice el tipo de datos table
de MATLAB® en su lugar. Para obtener más información, consulte la documentación de table
de MATLAB.
Descripción
Los arreglos de conjuntos de datos se utilizan para recopilar datos y metadatos heterogéneos, incluyendo los nombres de variables y observaciones, en una única variable contenedora. Los arreglos de conjuntos de datos son adecuados para almacenar datos tabulares u orientados a columnas que suelen almacenarse como columnas en un archivo de texto o en una hoja de cálculo, y pueden dar cabida a variables de distintos tipos, tamaños, unidades, etc.
Los arreglos de conjuntos de datos pueden contener distintos tipos de variables, como numéricas, lógicas, de caracteres, de cadena, categóricas y de celda. Sin embargo, la clase de un arreglo de conjuntos de datos es diferente de las variables que contiene. Por ejemplo, incluso un arreglo de conjuntos de datos que solo contenga variables que sean arreglos dobles no puede utilizarse como si el propio arreglo de conjuntos de datos fuera un arreglo doble. Sin embargo, si se utiliza la notación de puntos, puede operar con una variable de un arreglo de conjunto de datos como si fuera una variable del área de trabajo.
Se puede utilizar la notación de paréntesis con arreglos de conjuntos de datos, de forma muy similar a los arreglos numéricos ordinarios, pero además de índices numéricos y lógicos, puede utilizar nombres de variables y observaciones como índices.
Construcción
Utilice el constructor dataset
para crear un arreglo de conjuntos de datos a partir de variables en el área de trabajo de MATLAB. También puede crear un arreglo de conjuntos de datos leyendo datos de un archivo de texto u hoja de cálculo. Puede acceder a cada variable de un arreglo de conjuntos de datos como si se tratara de campos de una estructura, utilizando la indexación por puntos mediante subíndices. Para ver una lista de las operaciones disponibles para los arreglos de conjuntos de datos, consulte la siguiente sección.
dataset | (Not Recommended) Construct dataset array |
Métodos
cat | (Not Recommended) Concatenate dataset arrays |
cellstr | (Not Recommended) Create cell array of character vectors from dataset array |
dataset2cell | (Not Recommended) Convert dataset array to cell array |
dataset2struct | (Not Recommended) Convert dataset array to structure |
datasetfun | (Not Recommended) Apply function to dataset array variables |
disp | (Not Recommended) Display dataset array |
display | (No recomendado) Mostrar un arreglo de tipo dataset |
double | (Not Recommended) Convert dataset variables to double array |
end | (No se recomienda) Último índice en la expresión de indexación del arreglo del conjunto de datos |
export | (Not Recommended) Write dataset array to file |
get | (Not Recommended) Access dataset array properties |
horzcat | (Not Recommended) Horizontal concatenation for dataset arrays |
intersect | (Not Recommended) Set intersection for dataset array observations |
isempty | (Not Recommended) True for empty dataset array |
ismember | (Not Recommended) Dataset array elements that are members of set |
ismissing | (Not Recommended) Find dataset array elements with missing values |
join | (Not Recommended) Merge dataset array observations |
length | (Not Recommended) Length of dataset array |
ndims | (Not Recommended) Number of dimensions of dataset array |
numel | (Not Recommended) Number of elements in dataset array |
replaceWithMissing | (Not Recommended) Insert missing data indicators into a dataset array |
replacedata | (Not Recommended) Replace dataset variables |
set | (Not Recommended) Set and display dataset array properties |
setdiff | (Not Recommended) Set difference for dataset array observations |
setxor | (Not Recommended) Set exclusive or for dataset array observations |
single | (Not Recommended) Convert dataset variables to single array |
size | (Not Recommended) Size of dataset array |
sortrows | (Not Recommended) Sort rows of dataset array |
stack | (Not Recommended) Stack dataset array from multiple variables into single variable |
subsasgn | (Not Recommended) Subscripted assignment to dataset array |
subsref | (Not Recommended) Subscripted reference for dataset array |
summary | (Not Recommended) Print summary of dataset array |
union | (Not Recommended) Set union for dataset array observations |
unique | (Not Recommended) Unique observations in dataset array |
unstack | (Not Recommended) Unstack dataset array from single variable into multiple variables |
vertcat | (Not Recommended) Vertical concatenation for dataset arrays |
Propiedades
Un arreglo de conjuntos de datos D
tiene propiedades que almacenan metadatos (información sobre los datos). Acceda a estos metadatos o asígnelos a una propiedad mediante P = D.Properties.PropName
o D.Properties.PropName = P
, donde PropName
es uno de los siguientes:
|
|
|
Un arreglo de celdas de dos elementos de vectores de caracteres que da los nombres de las dos dimensiones del arreglo de conjuntos de datos. El valor predeterminado es |
|
Un arreglo de celdas de vectores de caracteres distintos y no vacíos que da los nombres de las observaciones del arreglo de conjuntos de datos. Esta propiedad puede estar vacía, pero si no lo está, el número de vectores de caracteres debe ser igual al número de observaciones. |
|
Un arreglo de celdas de vectores de caracteres que da las unidades de las variables del arreglo de conjuntos de datos. Esta propiedad puede estar vacía, pero si no lo está, el número de vectores de caracteres debe ser igual al número de variables. Cualquier vector de caracteres individual puede estar vacío para una variable que no tenga unidades definidas. El valor predeterminado es un arreglo de celdas vacío. |
|
Cualquier variable que contenga información adicional que deba asociarse al arreglo de conjuntos de datos. El valor predeterminado es un arreglo vacío. |
|
Un arreglo de celdas de vectores de caracteres que da las descripciones de las variables del arreglo de conjuntos de datos. Esta propiedad puede estar vacía, pero si no lo está, el número de vectores de caracteres debe ser igual al número de variables. Cualquier vector de caracteres individual puede estar vacío para una variable que no tenga una descripción definida. El valor predeterminado es un arreglo de celdas vacío. |
|
Un arreglo de celdas de vectores de caracteres distintos y no vacíos que da los nombres de las variables del arreglo de conjuntos de datos. El número de vectores de caracteres debe ser igual al número de variables. El valor predeterminado es el arreglo de celdas de los nombres de las variables utilizadas para crear el conjunto de datos. |
Semántica de copia
Valor. Para saber cómo afecta esto al uso de la clase, consulte Comparing Handle and Value Classes en la documentación sobre la programación orientada a objetos de MATLAB.
Ejemplos
Cargue un arreglo de conjuntos de datos desde un archivo .mat y cree algunos subconjuntos sencillos:
load hospital h1 = hospital(1:10,:) h2 = hospital(:,{'LastName' 'Age' 'Sex' 'Smoker'}) % Access and modify metadata hospital.Properties.Description hospital.Properties.VarNames{4} = 'Wgt' % Create a new dataset variable from an existing one hospital.AtRisk = hospital.Smoker | (hospital.Age > 40) % Use individual variables to explore the data boxplot(hospital.Age,hospital.Sex) h3 = hospital(hospital.Age<30,... {'LastName' 'Age' 'Sex' 'Smoker'}) % Sort the observations based on two variables h4 = sortrows(hospital,{'Sex','Age'})