Contenuto principale

La traduzione di questa pagina non è aggiornata. Fai clic qui per vedere l'ultima versione in inglese.

Elaborazione audio

Estendere i workflow di Deep Learning con le applicazioni di elaborazione di audio e parlato

Applicare il Deep Learning alle applicazioni di elaborazione di audio e parlato utilizzando Deep Learning Toolbox™ insieme a Audio Toolbox™. Per le applicazioni di elaborazione del segnale, vedere Elaborazione del segnale. Per le applicazioni nelle comunicazioni wireless, vedere Comunicazioni wireless.

App

Signal LabelerLabel signal attributes, regions, and points of interest

Funzioni

espandi tutto

audioDatastoreDatastore for collection of audio files
audioDataAugmenterAugment audio data
audioFeatureExtractorStreamline audio feature extraction
openl3EmbeddingsExtract OpenL3 feature embeddings (Da R2022a)
pitchnnEstimate pitch with deep learning neural network (Da R2021a)
vggishEmbeddingsExtract VGGish feature embeddings (Da R2022a)
audioPretrainedNetworkPretrained audio neural networks (Da R2024a)
classifySoundClassify sounds in audio signal
pitchnnEstimate pitch with deep learning neural network (Da R2021a)
vggishEmbeddingsExtract VGGish feature embeddings (Da R2022a)
openl3EmbeddingsExtract OpenL3 feature embeddings (Da R2022a)
detectspeechnnDetect boundaries of speech in audio signal using AI (Da R2023a)
separateSpeakersSeparate signal by speakers (Da R2023b)

Blocchi

espandi tutto

VGGishVGGish embeddings extraction network (Da R2022a)
VGGish EmbeddingsExtract VGGish embeddings (Da R2022a)
YAMNetYAMNet sound classification network (Da R2021b)
Sound ClassifierClassify sounds in audio signal (Da R2021b)
OpenL3OpenL3 embeddings extraction network (Da R2022b)
OpenL3 EmbeddingsExtract OpenL3 embeddings (Da R2022b)
CREPECREPE deep pitch estimation neural network (Da R2023a)
Deep Pitch EstimatorEstimate pitch with CREPE deep learning neural network (Da R2023a)

Argomenti

Esempi in primo piano