Come iniziare con la compressione della rete

Imparare le nozioni di base di Deep Learning Toolbox™ Model Compression Library

Utilizzare Deep Learning Toolbox insieme al pacchetto di supporto Deep Learning Toolbox Model Compression Library per ridurre l’ingombro della memoria e i requisiti di calcolo di una rete neurale profonda tramite:

Sfoltire i filtri dai livelli convoluzionali utilizzando l'approssimazione di Taylor del primo ordine.
Proiettare i livelli eseguendo un'analisi dei componenti principali (PCA) sulle attivazioni del livello.
Quantizzare i pesi, i bias e le attivazioni dei livelli in tipi di dato interi scalati a precisione ridotta.

È quindi possibile generare codice dalla rete compressa per la distribuzione sull'hardware desiderato.

Diagram of suggested compression workflow: first pruning, then projection, then quantization, then code generation.

Argomenti

Reduce Memory Footprint of Deep Neural Networks
Learn about neural network compression techniques, including pruning, projection, and quantization.