Main Content

La traducción de esta página aún no se ha actualizado a la versión más reciente. Haga clic aquí para ver la última versión en inglés.

Procesamiento de sonido

Amplíe flujos de trabajo de deep learning con aplicaciones de procesamiento de audio y voz

Aplique deep learning a aplicaciones de procesamiento de audio y voz con Deep Learning Toolbox™ y Audio Toolbox™. Para obtener información sobre las aplicaciones de procesamiento de señales, consulte Procesamiento de señales. Para obtener información sobre las aplicaciones de comunicaciones inalámbricas, consulte Comunicaciones inalámbricas.

Apps

Signal LabelerEtiquete atributos de señal, regiones y puntos de interés y extraiga características

Funciones

expandir todo

audioDatastoreDatastore for collection of audio files
audioDataAugmenterAugment audio data (desde R2019b)
audioFeatureExtractorStreamline audio feature extraction (desde R2019b)
openl3EmbeddingsExtract OpenL3 feature embeddings (desde R2022a)
pitchnnEstimate pitch with deep learning neural network (desde R2021a)
vggishEmbeddingsExtract VGGish feature embeddings (desde R2022a)
yamnet(Not recommended) YAMNet neural network (desde R2020b)
classifySoundClassify sounds in audio signal (desde R2020b)
crepe(Not recommended) CREPE neural network (desde R2021a)
pitchnnEstimate pitch with deep learning neural network (desde R2021a)
vggish(Not recommended) VGGish neural network (desde R2020b)
vggishEmbeddingsExtract VGGish feature embeddings (desde R2022a)
openl3(Not recommended) OpenL3 neural network (desde R2021a)
openl3EmbeddingsExtract OpenL3 feature embeddings (desde R2022a)
vadnet(Not recommended) Voice activity detection (VAD) neural network (desde R2023a)
detectspeechnnDetect boundaries of speech in audio signal using AI (desde R2023a)
separateSpeakersSeparate signal by speakers (desde R2023b)

Bloques

expandir todo

VGGishVGGish embeddings extraction network (desde R2022a)
VGGish EmbeddingsExtract VGGish embeddings (desde R2022a)
YAMNetYAMNet sound classification network (desde R2021b)
Sound ClassifierClassify sounds in audio signal (desde R2021b)
OpenL3OpenL3 embeddings extraction network (desde R2022b)
OpenL3 EmbeddingsExtract OpenL3 embeddings (desde R2022b)
CREPECREPE deep pitch estimation neural network (desde R2023a)
Deep Pitch EstimatorEstimate pitch with CREPE deep learning neural network (desde R2023a)

Temas