Main Content

La traducción de esta página aún no se ha actualizado a la versión más reciente. Haga clic aquí para ver la última versión en inglés.

Cuantificación y poda

Comprima una red neuronal profunda mediante el proceso de cuantificación o poda

Utilice Deep Learning Toolbox™ con el paquete de soporte Deep Learning Toolbox Model Quantization Library para reducir el uso de memoria y los requisitos computacionales de una red neuronal profunda de las siguientes formas:

  • Cuantificando los pesos, los sesgos y las activaciones de capas en tipos de datos de precisión enteros escalados. Después, podrá generar código C/C++, CUDA® o HDL a partir de esta red cuantificada.

  • Podando filtros desde las capas de convolución mediante una aproximación de Taylor de primer orden. Después, podrá generar código C/C++, CUDA o HDL a partir de esta red podada.

Funciones

expandir todo

dlquantizerQuantize a deep neural network to 8-bit scaled integer data types
dlquantizationOptionsOptions for quantizing a trained deep neural network
calibrateSimulate and collect ranges of a deep neural network
validateQuantize and validate a deep neural network
quantizeQuantize deep neural network
estimateNetworkMetricsEstimate network metrics for specific layers of a neural network
quantizationDetailsDisplay quantization details for a neural network
taylorPrunableNetworkNetwork that can be pruned by using first-order Taylor approximation
forwardCompute deep learning network output for training
predictCompute deep learning network output for inference
updatePrunablesRemove filters from prunable layers based on importance scores
updateScoreCompute and accumulate Taylor-based importance scores for pruning
dlnetworkDeep learning network for custom training loops

Apps

Deep Network QuantizerQuantize a deep neural network to 8-bit scaled integer data types

Temas

Cuantificación de deep learning

Cuantificación para un objetivo GPU

Cuantificación para un objetivo FPGA

Cuantificación para un objetivo CPU

Poda