Visualice la frecuencia de las palabras en una nube de palabras
Este ejemplo muestra cómo visualizar la distribución de texto utilizando Text Analytics Toolbox™ en una nube de palabras. Utilice ThingSpeak™ para ordenar el texto y ver qué parámetros influyen en la distribución o sentimiento.
CheerLights permite a personas de todo el mundo sincronizarse con un color establecido por Twitter. ThingSpeak Channel 1417 almacena el historial de colores de CheerLights. Lea palabras del canal ThingSpeak y compare la distribución de las marcas de tiempo tempranas y tardías.
Leer datos de texto y calcular la frecuencia de palabras
Lea los últimos 500 puntos de datos del canal CheerLights ThingSpeak. Encuentre la frecuencia de las palabras en cada documento de una colección usando la función bagofwords
en Text Analytics Toolbox.
colorData = thingSpeakRead(1417,'numPoints',500,'OutputFormat','Timetable','fields', [1]); bagOfWords(colorData.LastCheerLightsCommand')
ans = bagOfWords with properties: Counts: [61 68 40 59 23 42 52 59 40 46 10] Vocabulary: [1×11 string] NumWords: 11 NumDocuments: 1
Ordenar resultados por tiempo
Encuentre el índice de cada punto de datos con una marca de tiempo anterior a la hora del almuerzo y luego busque todos los índices de los puntos de datos después del almuerzo. Utilice los índices para crear una matriz de todas las palabras para cada caso.
lateTimeIndex = (hour(colorData.Timestamps) > 12); earlyTimeIndex = (hour(colorData.Timestamps) < 12); lateColors = colorData.LastCheerLightsCommand(lateTimeIndex); earlyColors = colorData.LastCheerLightsCommand(earlyTimeIndex);
Comparar la frecuencia de las palabras en la nube de palabras
Utilice los datos ordenados para generar las nubes de palabras. La función subplot
le permite compararlos uno al lado del otro.
subplot(1,2,1); earlyWordCloud = wordcloud(earlyColors,'Color','blue') title('Early Morning CheerLights'); subplot(1,2,2); lateWordCloud = wordcloud(lateColors,'color','green') title('Late Night CheerLights');
earlyWordCloud = WordCloudChart with properties: WordData: [1×11 string] SizeData: [67 60 58 58 49 46 42 40 40 22 10] MaxDisplayWords: 100 Use GET to show all properties lateWordCloud = WordCloudChart with properties: WordData: ["cyan" "magenta" "red" "white"] SizeData: [1 1 1 1] MaxDisplayWords: 100 Use GET to show all properties
La distribución de colores enviados a CheerLights parece depender sólo ligeramente de la hora del día de la publicación. Algunos colores son fuertes sólo por la tarde y otros son consistentemente fuertes durante todo el día.
Consulte también
Get Started with Text Analytics Toolbox (Text Analytics Toolbox) | wordcloud
(Text Analytics Toolbox)