Text Analytics Toolbox

 

Text Analytics Toolbox

Analisi e modellazione di dati di testo

Inizia ora:

Importazione e visualizzazione di dati di testo

Estrai dati di testo da fonti quali social media, feed di notizie, registri di apparecchiature, report e sondaggi.

Estrazione di dati di testo

Importa dati di testo in MATLAB® da file singoli o da grandi serie di file, inclusi file PDF, HTML, Microsoft® Word® e Excel®.

Estrazione di testo da una serie di documenti Microsoft Word.

Visualizzazione del testo

Esplora visivamente i set di dati di testo tramite nuvole di parole e grafici a dispersione di testo.

Word cloud che illustra la frequenza relativa delle parole sulla base delle dimensioni e del colore del font.

Supporto linguistico

Text Analytics Toolbox fornisce funzionalità di pre-elaborazione specifiche per la lingua inglese, giapponese, tedesca e coreana. La maggior parte delle funzionalità è compatibile anche con testo in altre lingue.

Importazione, preparazione e analisi di testo giapponese.

Pre-elaborazione dei dati di testo

Estrai parole significative da testo non elaborato.

Pulizia dei dati di testo

Applica filtri di alto livello per rimuovere il contenuto non rilevante come URL, tag HTML, punteggiatura e per correggere l’ortografia.

Semplificazione di testo non elaborato (sinistra) per lavorare con le parole più significative (destra).

Filtraggio delle stop word e normalizzazione delle parole alla forma radice

Dai priorità ai dati di testo significativi nella tua analisi filtrando le parole comuni, quelle che compaiono troppo frequentemente o raramente, quelle molto lunghe o molto brevi. Limita il lessico e concentrati sul senso più generale o sul sentiment di un documento, eseguendo lo stemming delle parole alla loro forma radice o convertendole in lemmi.

Rimozione di stop word come articoli e preposizioni (“un” e “di”, per esempio) dai documenti.

Individuazione di token, frasi e parti del discorso

Dividi automaticamente il testo non elaborato in una serie di parole utilizzando un algoritmo di tokenizzazione. Aggiungi i limiti delle frasi, le varie parti del discorso e altre informazioni rilevanti per il contesto.

Aggiunta di dettagli relativi a parti del discorso e frasi ai documenti sottoposti a tokenizzazione.

Conversione del testo in formati numerici

Converti i dati di testo in formato numerico per utilizzarli con il machine learning e il deep learning.

Conteggio di parole e n-grammi

Calcola le statistiche di frequenza delle parole per rappresentare numericamente i dati di testo.

Individuazione e visualizzazione delle parole che ricorrono più frequentemente in un modello.

Word Embedding e codifica

Addestra modelli di Word Embedding come i modelli word2vec, CBOW (continuous bag-of-words) e skip gram. Importa modelli pre-addestrati tra cui fastText e GloVe.

Visualizzazione dei cluster in un grafico a dispersione di testo tramite Word Embedding. 

Machine learning con dati di testo

Esegui topic modeling, sentiment analysis, classificazione, riduzione della dimensionalità ed estrazione di sintesi utilizzando algoritmi di Machine Learning.

Topic modeling

Scopri e visualizza pattern, trend e relazioni complesse sottostanti in grandi serie di dati di testo usando algoritmi di machine learning come l’allocazione Dirichlet latente (LDA) e l’analisi semantica latente (LSA).

Individuazione dei topic nei dati di un report su un temporale.

Sintesi di documenti ed estrazione di parole chiave

Estrai automaticamente una sintesi e le parole chiave rilevanti da uno o più documenti e valuta i documenti in termini di importanza e somiglianza.

Estrazione di una sintesi da un testo.

Sentiment analysis

Identifica gli atteggiamenti e le opinioni espressi nei dati di testo per classificare le affermazioni come positive, neutre o negative. Costruisci modelli che possono prevedere il sentiment in tempo reale.

Identifica le parole che predicono il sentiment positivo e negativo.

Deep learning con dati di testo

Esegui sentiment analysis, classificazione, sintesi e generazione di testo utilizzando algoritmi di Deep Learning.

Modelli di trasformatori

Sfrutta i modelli di trasformatori come BERT, FinBERT, e GPT-2 per eseguire il transfer learning con i dati di testo per attività come sentiment analysis, classificazione e sintesi.

Modelli di trasformatori per transfer learning con dati di testo.

Addestramento di una rete neurale profonda per classificare i dati di testo.

Generazione di testo utilizzando Orgoglio e pregiudizio di Jane Austen e una rete LSTM di deep learning.