dlarray

Arreglo de deep learning para personalización

Descripción

Un arreglo de deep learning almacena datos con etiquetas de formato opcionales de datos para bucles de entrenamiento personalizados y permite que las funciones calculen y usen derivadas a través de la diferenciación automática.

Sugerencia

Para la mayor parte de las tareas de deep learning, puede utilizar una red neuronal preentrenada y adaptarla a sus propios datos. Para ver un ejemplo de cómo usar la transferencia del aprendizaje para volver a entrenar una red neuronal convolucional para clasificar un nuevo conjunto de imágenes, consulte Volver a entrenar redes neuronales para clasificar nuevas imágenes. Como alternativa, puede crear y entrenar redes neuronales desde cero usando las funciones trainnet y trainingOptions.

Si la función trainingOptions no proporciona las opciones de entrenamiento que necesita para la tarea, puede crear un bucle de entrenamiento personalizado mediante diferenciación automática. Para obtener más información, consulte Entrenar una red con un bucle de entrenamiento personalizado.

Si la función trainnet no proporciona la función de pérdida que necesita para la tarea, puede especificar una función de pérdida personalizada para trainnet como identificador de función. Para las funciones de pérdida que requieren más entradas que las predicciones y los objetivos (por ejemplo, funciones de pérdida que requieren acceso a la red neuronal o entradas adicionales), entrene el modelo usando un bucle de entrenamiento personalizado. Para obtener más información, consulte Entrenar una red con un bucle de entrenamiento personalizado.

Si Deep Learning Toolbox™ no proporciona las capas que necesita para la tarea, puede crear una capa personalizada. Para obtener más información, consulte Definir capas de deep learning personalizadas. Para los modelos que no se pueden especificar como redes de capas, puede definir el modelo como una función. Para obtener más información, consulte Train Network Using Model Function.

Para obtener más información sobre qué método de entrenamiento usar para cada tarea, consulte Train Deep Learning Model in MATLAB.

Creación

Sintaxis

dlX = dlarray(X)

dlX = dlarray(X,fmt)

dlX = dlarray(v,dim)

Descripción

dlX = dlarray(X) devuelve un objeto dlarray que representa X. Si X es un dlarray, dlX es una copia de X.

ejemplo

dlX = dlarray(X,fmt) formatea los datos de dlX con etiquetas de dimensión según el formato de los datos en fmt. Las etiquetas de dimensión ayudan a pasar datos de deep learning entre funciones. Para obtener más información sobre las etiquetas de dimensión, consulte Uso. Si X es un dlarray con formato, fmt reemplaza el formato existente.

ejemplo

dlX = dlarray(v,dim) acepta un vector v y un formato de un solo carácter dim, y devuelve un vector columna dlarray. La primera dimensión de dlX tiene la etiqueta de dimensión dim, y la segunda dimensión (única) tiene la etiqueta de dimensión 'U'.

ejemplo

Argumentos de entrada

expandir todo

`X` — Arreglo de datos
arreglo numérico del tipo de datos `double` o `single` | arreglo `logical` | objeto `gpuArray` | objeto `dlarray`

Arreglo de datos, especificado como un arreglo numérico del tipo de datos double o single, un arreglo logical, un objeto gpuArray o un objeto dlarray. X debe estar lleno, no disperso.

Ejemplo: rand(31*23,23)

Tipos de datos: single | double | logical
Soporte de números complejos: Sí

`fmt` — Formato de los datos
vector de caracteres | escalar de cadena

Formato de los datos, especificado como escalar de cadena o vector de caracteres. Cada carácter de la cadena debe ser una de las etiquetas de dimensión siguientes:

"S": espacial
"C": canal
"B": lote
"T": tiempo
"U": sin especificar

Puede especificar varias dimensiones etiquetadas "S" o "U". Puede utilizar las etiquetas "C", "B" y "T" como máximo una vez cada una. El software ignora las dimensiones únicas "U" restantes tras la segunda dimensión.

Cuando crea un objeto dlarray con formato, el software automáticamente permuta las dimensiones, de tal manera que las dimensiones del formato se encuentran en este orden:

"S"
"C"
"B"
"T"
"U"

Por ejemplo, si especifica un formato de "TCB" (tiempo, canal, lote). el software automáticamente permuta las dimensiones para que tengan el formato "CBT" (canal, lote, tiempo).

fmt debe contener al menos el mismo número de etiquetas que el número de dimensiones de los datos de entrada. Si especifica más etiquetas de dimensión que el número de dimensiones de los datos de entrada, dlarray creará dimensiones vacías (únicas) para las etiquetas adicionales.

En la siguiente tabla se indican los formatos de datos recomendados para tipos de datos habituales.

Datos	Ejemplo
Datos	Forma	Formato de los datos
Imágenes 2D	Arreglo numérico de h por w por c por n, donde h, w, c y n son la altura, la anchura, el número de canales de las imágenes y el número de observaciones, respectivamente.	`"SSCB"`
Imágenes 3D	Arreglo numérico de h por w por d por c por n, en el que h, w, d, c y n son la altura, la anchura, el número de canales de las imágenes y el número de observaciones de las imágenes, respectivamente.	`"SSSCB"`
Secuencias de vectores	Matriz de c por s por n, donde c es el número de características de la secuencia, s es la longitud de la secuencia y n es el número de observaciones de la secuencia.	`"CTB"`
Secuencias de imágenes 2D	Arreglo de h por w por c por s por n, donde h, w y c corresponden a la altura, la anchura y el número de canales de la imagen, respectivamente, s es la longitud de la secuencia y n es el número de observaciones de la secuencia de la imagen.	`"SSCTB"`
Secuencias de imágenes 3D	Arreglo de h por w por d por c por s por n, donde h, w, d y c corresponden a la altura, la anchura, la profundidad y el número de canales de la imagen, respectivamente, s es la longitud de la secuencia y n es el número de observaciones de la secuencia de la imagen.	`"SSSCTB"`
Características	Arreglo de c por n, donde c es el número de características y n es el número de observaciones.	`"CB"`

`v` — Vector de datos
Vector numérico del tipo de datos doble o simple | vector lógico | Objeto de vector `dlarray`

Vector de datos, especificado como un vector numérico de tipo de datos doble o simple, vector lógico u objeto de vector dlarray. Aquí, "vector" se refiere a cualquier arreglo con exactamente una dimensión no única.

Ejemplo: rand(100,1)

`dim` — Etiqueta de dimensión
carácter único

Etiqueta de dimensión, especificada como un solo carácter del tipo permitido para fmt.

Ejemplo: "S"

Ejemplo: 'S'

Argumentos de salida

expandir todo

`dlX` — Arreglo de deep learning
objeto `dlarray`

Arreglo de deep learning, devuelto como un objeto dlarray. dlX permite la diferenciación automática empleando dlgradient y dlfeval. Si proporciona el argumento fmt, dlX tiene etiquetas.

Si X es un arreglo numérico o lógico, dlX contiene sus datos, posiblemente reordenados por el formato de los datos en fmt.
Si X es un gpuArray, los datos en dlX también se encuentran en la GPU. Los cálculos subsiguientes empleando dlX se llevan a cabo en la GPU.

Uso

Los formatos de datos dlarray permiten ejecutar las funciones en la tabla siguiente con la seguridad de que los datos tienen la forma adecuada.

Función	Operación	Valida la dimensión de entrada	Afecta al tamaño de la dimensión de entrada
`avgpool`	Calcula el promedio de los datos de entrada sobre regiones espaciales rectangulares (o cúbicas) (`'S'`) móviles definidas por un parámetro de tamaño de grupo.	`'S'`	`'S'`
`batchnorm`	Permite normalizar los valores contenidos en cada canal (`'C'`) de los datos de entrada.	`'C'`
`crossentropy`	Permite calcular la entropía cruzada entre las estimaciones y los valores objetivo, promediada por el tamaño de la dimensión del lote (`'B'`).	`'S'`, `'C'`, `'B'`, `'T'`, `'U'` (Las estimaciones y los arreglos objetivo deben tener el mismo tamaño).	`'S'`, `'C'`, `'B'`, `'T'`, `'U'` (La salida es un escalar sin formato).
`dlconv`	Permite calcular la convolución de deep learning de los datos de entrada utilizando un arreglo de filtros, coincidiendo con el número de dimensiones espaciales (`'S'`) y (una función de las) dimensiones del canal (`'C'`) de entrada y añadiendo un sesgo constante.	`'S'`, `'C'`	`'S'`, `'C'`
`dltranspconv`	Permite calcular la convolución traspuesta de deep learning de los datos de entrada utilizando un arreglo de filtros, coincidiendo con el número de dimensiones espaciales (`'S'`) y (una función de las) dimensiones del canal (`'C'`) de entrada y añadiendo un sesgo constante.	`'S'`, `'C'`	`'S'`, `'C'`
`fullyconnect`	Permite calcular una suma ponderada de los datos de entrada y aplicar un sesgo para la dimensión de cada lote (`'B'`) y tiempo (`'T'`).	`'S'`, `'C'`, `'U'`	`'S'`, `'C'`, `'B'`, `'T'`, `'U'` (La salida siempre tiene el formato de datos `'CB'`, `'CT'` o `'CBT'`).
`gru`	Permite aplicar un cálculo de unidad recurrente cerrada a los datos de entrada.	`'S'`, `'C'`, `'T'`	`'C'`
`lstm`	Permite aplicar un cálculo de memoria de corto-largo plazo a los datos de entrada.	`'S'`, `'C'`, `'T'`	`'C'`
`maxpool`	Permite calcular el máximo de los datos de entrada sobre regiones espaciales (`'S'`) rectangulares en movimiento definidas por un parámetro de tamaño de grupo.	`'S'`	`'S'`
`maxunpool`	Permite calcular la operación de desagrupar las dimensiones espaciales (`'S'`).	`'S'`	`'S'`
`mse`	Permite calcular el error cuadrático medio a la mitad entre las estimaciones y los valores objetivo, promediado por el tamaño de la dimensión del lote (`'B'`).	`'S'`, `'C'`, `'B'`, `'T'`, `'U'` (Las estimaciones y los arreglos objetivo deben tener el mismo tamaño).	`'S'`, `'C'`, `'B'`, `'T'`, `'U'` (La salida es un escalar sin formato).
`softmax`	Permite aplicar la activación softmax a cada canal (`'C'`) de los datos de entrada.	`'C'`

Estas dimensiones requieren que cada dimensión tenga una etiqueta. Puede especificar el formato de etiqueta de dimensión proporcionando la primera entrada como un dlarray con formato o utilizando el argumento de nombre-valor 'DataFormat' de la función.

dlarray aplica el orden de la etiqueta de dimensión de 'SCBTU'. Esta operación elimina la semántica ambigua en las operaciones que emparejan implícitamente las etiquetas entre entradas. dlarray también hace que las etiquetas de dimensión 'C', 'B' y 'T' solo puedan aparecer como máximo una vez cada una. Las funciones que usan estas etiquetas de dimensión aceptan como máximo una dimensión para cada etiqueta.

dlarray proporciona funciones para obtener el formato de datos asociado con un dlarray (dims), eliminar el formato de datos (stripdims) y obtener las dimensiones asociadas con etiquetas de dimensión concretas (finddim).

Para obtener más información sobre cómo funciona dlarray con formatos, consulte Notable dlarray Behaviors.

Funciones del objeto

`avgpool`	Pool data to average values over spatial dimensions
`batchnorm`	Normalize data across all observations for each channel independently
`crossentropy`	Cross-entropy loss for classification tasks
`indexcrossentropy`	Index cross-entropy loss for classification tasks
`dims`	Formato de datos de un objeto `dlarray`
`dlconv`	Deep learning convolution
`dldivergence`	Divergence of deep learning data
`dlgradient`	Calcular gradientes para bucles de entrenamiento personalizados usando diferenciación automática
`dljacobian`	Jacobian matrix deep learning operation
`dllaplacian`	Laplacian of deep learning data
`dltranspconv`	Deep learning transposed convolution
`extractdata`	Extraer datos de `dlarray`
`finddim`	Find dimensions with specified label
`fullyconnect`	Sum all weighted input data and apply a bias
`gru`	Unidad recurrente cerrada
`leakyrelu`	Aplicar la activación de unidad lineal rectificada con fugas
`lstm`	Memoria de corto-largo plazo
`maxpool`	Pool data to maximum value
`maxunpool`	Unpool the output of a maximum pooling operation
`mse`	Error cuadrático medio dividido
`relu`	Aplicar la activación de unidad lineal rectificada
`sigmoid`	Aplicar la activación sigmoide
`softmax`	Apply softmax activation to channel dimension
`stripdims`	Remove `dlarray` data format

Un dlarray también permite funciones para operaciones numéricas, de matrices y de otros tipos. Puede consultar la lista completa en List of Functions with dlarray Support.

Ejemplos

contraer todo

Crear un `dlarray` sin formato

Abrir script en vivo

Cree un dlarray sin formato a partir de una matriz.

X = randn(3,5);
dlX = dlarray(X)

dlX = 
  3×5 dlarray

    0.5377    0.8622   -0.4336    2.7694    0.7254
    1.8339    0.3188    0.3426   -1.3499   -0.0631
   -2.2588   -1.3077    3.5784    3.0349    0.7147

Crear un `dlarray` con formato

Abrir script en vivo

Cree un dlarray que tenga un formato de datos que contenga las etiquetas de dimensión 'S' y 'C'.

X = randn(3,5);
dlX = dlarray(X,'SC')

dlX = 
  3(S) × 5(C) dlarray

    0.5377    0.8622   -0.4336    2.7694    0.7254
    1.8339    0.3188    0.3426   -1.3499   -0.0631
   -2.2588   -1.3077    3.5784    3.0349    0.7147

Si especifica las etiquetas de dimensión en el orden inverso, dlarray reordena implícitamente los datos subyacentes.

dlX = dlarray(X,'CS')

dlX = 
  5(S) × 3(C) dlarray

    0.5377    1.8339   -2.2588
    0.8622    0.3188   -1.3077
   -0.4336    0.3426    3.5784
    2.7694   -1.3499    3.0349
    0.7254   -0.0631    0.7147

Crear un vector de `dlarray` con formato

Abrir script en vivo

Cree un vector de dlarray con la primera etiqueta de dimensión 'T'. La segunda etiqueta de dimensión, que dlarray crea de forma automática, es 'U'.

X = randn(6,1);
dlX = dlarray(X,'T')

dlX = 
  6(T) × 1(U) dlarray

    0.5377
    1.8339
   -2.2588
    0.8622
    0.3188
   -1.3077

Si especifica un vector fila para X, dlarray reordena implícitamente el resultado para que sea un vector columna.

X = X';
dlX = dlarray(X,'T')

dlX = 
  6(T) × 1(U) dlarray

    0.5377
    1.8339
   -2.2588
    0.8622
    0.3188
   -1.3077

Sugerencias

Una llamada de dlgradient debe estar dentro de una función. Para obtener un valor numérico de un gradiente, debe evaluar la función utilizando dlfeval y el argumento de la función debe ser un objeto dlarray. Consulte Use Automatic Differentiation In Deep Learning Toolbox.
Para permitir la evaluación correcta de los gradientes, dlfeval debe llamar a funciones que solo usen funciones compatibles con dlarray. Consulte List of Functions with dlarray Support.

Capacidades ampliadas

expandir todo

Generación de código C/C++
Genere código C y C++ mediante MATLAB® Coder™.

Notas y limitaciones de uso:

Para obtener recomendaciones de uso y una lista de funciones con soporte de generación de código de dlarray, consulte Code Generation for dlarray (MATLAB Coder). Para ver un ejemplo que muestra cómo utilizar objetos dlnetwork y dlarray para generar MEX para una red de codificador automático variacional (VAE) entrenada, consulte Generate Digit Images Using Variational Autoencoder on Intel CPUs (MATLAB Coder).

Para conocer las limitaciones de generación de código de dlarray, consulte dlarray Limitations for Code Generation (MATLAB Coder).

Generación de código de GPU
Genere código CUDA® para GPU NVIDIA® mediante GPU Coder™.

Notas y limitaciones de uso:

Para obtener recomendaciones de uso y una lista de funciones con soporte de generación de código de dlarray, consulte Code Generation for dlarray (GPU Coder). Para ver un ejemplo que muestra cómo utilizar objetos dlnetwork y dlarray para generar CUDA^® MEX para una red de codificador automático variacional (VAE) entrenada, consulte Generate Digit Images on NVIDIA GPU Using Variational Autoencoder (GPU Coder).

Para conocer las limitaciones de generación de código de dlarray, consulte dlarray Limitations for Code Generation (GPU Coder).

Arreglos GPU
Acelere código mediante la ejecución en una unidad de procesamiento gráfico (GPU) mediante Parallel Computing Toolbox™.

La función dlarray es totalmente compatible con los arreglos de GPU. Para ejecutar la función en una GPU, especifique los datos de entrada como gpuArray (Parallel Computing Toolbox). Para obtener más información, consulte Run MATLAB Functions on a GPU (Parallel Computing Toolbox).

Historial de versiones

Introducido en R2019b

expandir todo

R2022b: Cambio en el comportamiento de la generación de código para las entradas y salidas de `dlarray`

En la versión R2022b, el código generado crea estructuras para las entradas y salidas de dlarray de las funciones de punto de entrada. Data es un campo público al que puede acceder directamente.

En versiones anteriores, el código generado utiliza una clase para representar las entradas y salidas de dlarray de las funciones de punto de entrada. En estas versiones, se utiliza la función de inicialización init para acceder al campo Data.

Consulte también

dlarray

Descripción

Creación

Sintaxis

Descripción

Argumentos de entrada

X — Arreglo de datos arreglo numérico del tipo de datos double o single | arreglo logical | objeto gpuArray | objeto dlarray

fmt — Formato de los datos vector de caracteres | escalar de cadena

v — Vector de datos Vector numérico del tipo de datos doble o simple | vector lógico | Objeto de vector dlarray

dim — Etiqueta de dimensión carácter único

Argumentos de salida

dlX — Arreglo de deep learning objeto dlarray

Uso

Funciones del objeto

Ejemplos

Crear un dlarray sin formato

Crear un dlarray con formato

Crear un vector de dlarray con formato

Sugerencias

Capacidades ampliadas

Generación de código C/C++ Genere código C y C++ mediante MATLAB® Coder™.

Generación de código de GPU Genere código CUDA® para GPU NVIDIA® mediante GPU Coder™.

Arreglos GPU Acelere código mediante la ejecución en una unidad de procesamiento gráfico (GPU) mediante Parallel Computing Toolbox™.

Historial de versiones

R2022b: Cambio en el comportamiento de la generación de código para las entradas y salidas de dlarray

Consulte también

Temas

`X` — Arreglo de datos
arreglo numérico del tipo de datos `double` o `single` | arreglo `logical` | objeto `gpuArray` | objeto `dlarray`

`fmt` — Formato de los datos
vector de caracteres | escalar de cadena

`v` — Vector de datos
Vector numérico del tipo de datos doble o simple | vector lógico | Objeto de vector `dlarray`

`dim` — Etiqueta de dimensión
carácter único

`dlX` — Arreglo de deep learning
objeto `dlarray`

Crear un `dlarray` sin formato

Crear un `dlarray` con formato

Crear un vector de `dlarray` con formato

Generación de código C/C++
Genere código C y C++ mediante MATLAB® Coder™.

Generación de código de GPU
Genere código CUDA® para GPU NVIDIA® mediante GPU Coder™.

Arreglos GPU
Acelere código mediante la ejecución en una unidad de procesamiento gráfico (GPU) mediante Parallel Computing Toolbox™.

R2022b: Cambio en el comportamiento de la generación de código para las entradas y salidas de `dlarray`