Contenuto principale

Come iniziare con la compressione della rete

Imparare le nozioni di base di Deep Learning Toolbox™ Model Compression Library

Utilizzare Deep Learning Toolbox insieme al pacchetto di supporto Deep Learning Toolbox Model Compression Library per ridurre l’ingombro della memoria e i requisiti di calcolo di una rete neurale profonda tramite:

  • Sfoltire i filtri dai livelli convoluzionali utilizzando l'approssimazione di Taylor del primo ordine.

  • Proiettare i livelli eseguendo un'analisi dei componenti principali (PCA) sulle attivazioni del livello.

  • Quantizzare i pesi, i bias e le attivazioni dei livelli in tipi di dato interi scalati a precisione ridotta.

È quindi possibile generare codice dalla rete compressa per la distribuzione sull'hardware desiderato.

Diagram of suggested compression workflow: first pruning, then projection, then quantization, then code generation.

Argomenti

Esempi in primo piano