Contenuto principale

Quantizzazione

Quantizzare i parametri della rete in tipi di dato a precisione ridotta; preparare la rete di Deep Learning per la generazione di codice in virgola fissa

Quantizzare i pesi, i bias e le attivazioni dei livelli in tipi di dato interi scalati a precisione ridotta. È quindi possibile generare codice C/C++, CUDA® o HDL da questa rete quantizzata per la distribuzione su GPU, FPGA o CPU.

Per una panoramica dettagliata delle tecniche di compressione disponibili in Deep Learning Toolbox™ Model Compression Library, vedere Reduce Memory Footprint of Deep Neural Networks.

Simplified illustration of quantization. On the left is a sketch of a neural network consisting of three layers with two, three, and one neuron, respectively. Each neuron in every layer is connected to all neurons in neighboring layers. An arrow points to a second sketch on the right, which shows the same network with the weights indicated by dotted lines instead of full lines, which indicates that the weights are stored with smaller precision.

Funzioni

dlquantizerQuantize a deep neural network to 8-bit scaled integer data types
dlquantizationOptionsOptions for quantizing a trained deep neural network
prepareNetworkPrepare deep neural network for quantization (Da R2024b)
calibrateSimulate and collect ranges of a deep neural network
quantizeQuantize deep neural network (Da R2022a)
validateQuantize and validate a deep neural network
quantizationDetailsDisplay quantization details for a neural network (Da R2022a)
estimateNetworkMetricsEstimate network metrics for specific layers of a neural network (Da R2022a)
equalizeLayersEqualize layer parameters of deep neural network (Da R2022b)
exportNetworkToSimulinkGenerate Simulink model that contains deep learning layer blocks and subsystems that correspond to deep learning layer objects (Da R2024b)

App

Deep Network QuantizerQuantize deep neural network to 8-bit scaled integer data types

Argomenti

Informazioni sulla quantizzazione

Workflow di pre-distribuzione

Distribuzione

Considerazioni

Esempi in primo piano