Text Analytics Toolbox

Analisi e modellazione di dati di testo

Hai domande? Contatta l’ufficio commerciale.

Text Analytics Toolbox fornisce algoritmi e visualizzazioni per pre-elaborazione, analisi e modellizzazione di dati di testo. I modelli creati con il toolbox possono essere utilizzati in applicazioni per sentiment analysis, manutenzione predittiva e topic modeling.

Text Analytics Toolbox include strumenti per elaborare testi grezzi da sorgenti come registri delle attrezzature, elenco dei contenuti, report di operatori e social media. È possibile estrarre il testo da formati di file più noti, pre-elaborare testi grezzi, estrarre parole singole, convertire testi in rappresentazioni numeriche e costruire modelli statistici.

Attraverso l’uso di tecniche di Machine Learning come LSA, LDA e word embedding, è possibile trovare cluster e creare funzionalità da set di dati di testo di grandi dimensioni. Le funzionalità create con Text Analytics Toolbox possono essere unite alle funzionalità da altre sorgenti di dati per costruire modelli di Machine Learning che sfruttino dati testuali, numerici e di altri tipi.

Codice MATLAB che estrae dati di testo da documenti di Microsoft Word in un datastore.

Importazione e visualizzazione di testi

Importa dati di testo in MATLAB da file singoli o da insieme di file di grandi dimensioni, inclusi PDF, HTML e file Microsoft^® Word. Esplora visivamente set di dati di testo usando nuvole di parole e diagrammi di dispersione di testo.

Estrazione di dati di testo da PDF, HTML, Microsoft Word, Microsoft Excel e file CSV

Documentazione | Esempi

Schermata dell’attività Live Editor di pre-elaborazione di dati di testo con risultati visualizzati in una nuvola di parole.

Pulizia e pre-elaborazione di testo

Applica funzioni di filtraggio di alto livello per rimuovere contenuti estranei, come URL, tag HTML e punteggiatura. Correggi spelling, filtra stop word e normalizza parole alla loro forma radice.

Pulizia e pre-elaborazione di dati di testo in Live Editor

Documentazione | Esempi

Codice MATLAB per creare diagrammi di dispersione e diagramma del word embedding t-SNE creato.

Conversione di testo in un formato strutturato

Estrai funzionalità linguistiche utilizzando un algoritmo di tokenizzazione, calcola le statistiche di frequenza di parole per rappresentare i dati di testo in forma numerica e addestra modelli di word embedding come word2vec e skip-gram.

Scopri e visualizza i word embedding

Documentazione | Esempi

Workflow per eseguire Transfer Learning con il modello di trasformatore FinBERT su dati di testo per identificare gli atteggiamenti positivi e negativi.

Applicazione di IA per l’analisi testuale

Applica modelli di Machine Learning o Deep Learning come LSA, LDA e LSTM ai dati di testo. Sfrutta i modelli di trasformatore come BERT, FinBERT e GPT-2 per eseguire il Transfer Learning con i dati di testo.

Addestramento di un classificatore di documenti BERT

Documentazione | Esempi

Modelli linguistici di ampie dimensioni

Connetti MATLAB all’API Chat Completions di OpenAI™. Sfrutta le funzionalità di elaborazione del linguaggio naturale dei modelli di GPT all’interno del tuo ambiente MATLAB per attività come sintesi di testi e chat.

Modelli linguistici di ampie dimensioni (LLM) con MATLAB

Documentazione | Esempi

Illustrazione della pulizia dei dati di testo per l’elaborazione del linguaggio naturale. A sinistra: nuvola di parole di dati grezzi. A destra: nuvola di parole di dati puliti.

Analisi testuale per ingegneri

Sviluppa programmi di manutenzione predittiva basati su sensori e dati di registro di testo. Automatizza la formalizzazione di requisiti e il controllo di conformità.

Recupero delle informazioni con i dati degli ordini di lavoro

Documentazione | Esempi

Utilizza l’analisi del testo per sintetizzare più documenti in un unico documento.

Analisi dei documenti

Analizza testi con topic modeling per scoprire e visualizzare pattern sottostanti, trend e relazioni complesse. Riassumi documenti, estrai parole chiave e valuta l’importanza di un documento e la similarità.

Classificazione di dati di testo tramite reti neurali convoluzionali

Documentazione | Esempi

Nuvole di parole separate in parole positive e negative.

Sentiment analysis

Identifica gli atteggiamenti e le opinioni espressi nei dati di testo per classificare le affermazioni come positive, neutre o negative. Costruisci modelli che possono prevedere il sentiment in tempo reale.

Sentiment analysis in MATLAB

Documentazione | Esempi

Nuvola di parole del testo generato dal romanzo Orgoglio e pregiudizio.

Generazione di testi e classificazione

Utilizza il Deep Learning per generare nuovi testi basati sui testi osservati e per classificare le descrizioni di testi con word embedding che possono identificare le categorie.

Generazione di testo mediante autocodificatori

Documentazione | Esempi