Elaborazione del linguaggio naturale

Data Analytics utilizzando dati del linguaggio umano

L’elaborazione del linguaggio naturale (NLP o Natural Language Processing) indica l’ampia classe di tecniche computazionali per incorporare il parlato e dati di testo, insieme ad altri tipi di dati ingegneristici, per lo sviluppo di sistemi intelligenti.

I dati grezzi del linguaggio umano possono provenire da varie fonti, tra cui segnali audio, la rete e i social media, documenti e database che contengono informazioni preziose come comandi vocali, opinione pubblica su vari argomenti, dati operativi e report di manutenzione. L’elaborazione del linguaggio naturale può essere utilizzata per combinare e semplificare queste grandi fonti di dati, trasformandole in informazioni importanti con visualizzazioni, modelli topici e classificatori di machine learning. Ad esempio, con MATLAB® è possibile rilevare la presenza della voce umana in un frammento audio, realizzare una trascrizione di un discorso orale ed eseguire text mining e machine learning su queste fonti.

L’elaborazione del linguaggio naturale viene impiegata in ambito finanziario, manifatturiero, dell’elettronica, dei software, dell’informatica e in altri settori con applicazioni quali:

  • Automazione della classificazione delle recensioni in base alle opinioni, sia positive che negative
  • Calcolo della frequenza di parole o frasi nei documenti ed utilizzo di topic modeling
  • Sviluppo di piani di manutenzione predittiva di apparecchiature in base a dati di sensori e registri di testo
  • Etichettatura automatica di registrazioni vocale

Per saperne di più su come trarre informazioni dal parlato e dai dati di testo tramite l’elaborazione del linguaggio naturale, consultare Text Analytics Toolbox™, Audio Toolbox™ e Statistics and Machine Learning Toolbox™.

Vedere anche: data science, machine learning, deep learning, sentiment analysis, text mining, long short-term memory (LSTM) networks, N-gram, rete neurale ricorrente