Data Analytics utilizzando dati del linguaggio umano
L’elaborazione del linguaggio naturale (NLP o Natural Language Processing) indica l’ampia classe di tecniche computazionali per incorporare il parlato e dati di testo, insieme ad altri tipi di dati ingegneristici, per lo sviluppo di sistemi intelligenti.
I dati grezzi del linguaggio umano possono provenire da varie fonti, tra cui segnali audio, la rete e i social media, documenti e database che contengono informazioni preziose come comandi vocali, opinione pubblica su vari argomenti, dati operativi e report di manutenzione. L’elaborazione del linguaggio naturale può essere utilizzata per combinare e semplificare queste grandi fonti di dati, trasformandole in informazioni importanti con visualizzazioni, modelli topici e classificatori di machine learning. Ad esempio, con MATLAB® è possibile rilevare la presenza della voce umana in un frammento audio, realizzare una trascrizione di un discorso orale ed eseguire text mining e machine learning su queste fonti.
L’elaborazione del linguaggio naturale viene impiegata in ambito finanziario, manifatturiero, dell’elettronica, dei software, dell’informatica e in altri settori con applicazioni quali:
- Automazione della classificazione delle recensioni in base alle opinioni, sia positive che negative
- Calcolo della frequenza di parole o frasi nei documenti ed utilizzo di topic modeling
- Sviluppo di piani di manutenzione predittiva di apparecchiature in base a dati di sensori e registri di testo
- Etichettatura automatica di registrazioni vocale
Per saperne di più su come trarre informazioni dal parlato e dai dati di testo tramite l’elaborazione del linguaggio naturale, consultare Text Analytics Toolbox™, Audio Toolbox™ e Statistics and Machine Learning Toolbox™.
Esempi e consigli pratici
Riferimenti software
Vedere anche: data science, machine learning, deep learning, sentiment analysis, text mining, long short-term memory (LSTM) networks, N-gram, rete neurale ricorrente