Visualizza la frequenza delle parole in un Word Cloud
Questo esempio mostra come visualizzare la distribuzione del testo utilizzando Text Analytics Toolbox™ in un word cloud. Utilizza ThingSpeak™ per ordinare il testo e vedere quali parametri influenzano la distribuzione o il sentiment.
CheerLights consente alle persone di tutto il mondo di sincronizzarsi con un colore impostato da Twitter. ThingSpeak Channel 1417 memorizza la cronologia dei colori CheerLights. Leggi le parole dal canale ThingSpeak e confronta la distribuzione dei timestamp iniziali e successivi.
Leggi i dati di testo e calcola la frequenza delle parole
Leggi gli ultimi 500 punti dati dal canale CheerLights ThingSpeak . Trova la frequenza delle parole in ciascun documento di una raccolta utilizzando la funzione bagofwords
nel Text Analytics Toolbox.
colorData = thingSpeakRead(1417,'numPoints',500,'OutputFormat','Timetable','fields', [1]); bagOfWords(colorData.LastCheerLightsCommand')
ans = bagOfWords with properties: Counts: [61 68 40 59 23 42 52 59 40 46 10] Vocabulary: [1×11 string] NumWords: 11 NumDocuments: 1
Ordina i risultati per ora
Trova l'indice di ciascun punto dati con un timestamp prima dell'ora di pranzo, quindi trova tutti gli indici dei punti dati dopo pranzo. Utilizza gli indici per creare una matrice di tutte le parole per ciascun caso.
lateTimeIndex = (hour(colorData.Timestamps) > 12); earlyTimeIndex = (hour(colorData.Timestamps) < 12); lateColors = colorData.LastCheerLightsCommand(lateTimeIndex); earlyColors = colorData.LastCheerLightsCommand(earlyTimeIndex);
Confronta la frequenza delle parole in Word Cloud
Utilizza i dati ordinati per generare le word cloud. La funzione subplot
ti permette di confrontarli fianco a fianco.
subplot(1,2,1); earlyWordCloud = wordcloud(earlyColors,'Color','blue') title('Early Morning CheerLights'); subplot(1,2,2); lateWordCloud = wordcloud(lateColors,'color','green') title('Late Night CheerLights');
earlyWordCloud = WordCloudChart with properties: WordData: [1×11 string] SizeData: [67 60 58 58 49 46 42 40 40 22 10] MaxDisplayWords: 100 Use GET to show all properties lateWordCloud = WordCloudChart with properties: WordData: ["cyan" "magenta" "red" "white"] SizeData: [1 1 1 1] MaxDisplayWords: 100 Use GET to show all properties
La distribuzione dei colori inviati a CheerLights sembra dipendere solo vagamente dall'ora del giorno in cui viene pubblicato. Alcuni colori sono forti solo nel pomeriggio, mentre altri sono costantemente forti per tutto il giorno.
Vedi anche
Get Started with Text Analytics Toolbox (Text Analytics Toolbox) | wordcloud
(Text Analytics Toolbox)