Main Content

Esta página se ha traducido mediante traducción automática. Haga clic aquí para ver la última versión en inglés.

Visualice la frecuencia de las palabras en una nube de palabras

Este ejemplo muestra cómo visualizar la distribución de texto utilizando Text Analytics Toolbox™ en una nube de palabras. Utilice ThingSpeak™ para ordenar el texto y ver qué parámetros influyen en la distribución o sentimiento.

CheerLights permite a personas de todo el mundo sincronizarse con un color establecido por Twitter. ThingSpeak Channel 1417 almacena el historial de colores de CheerLights. Lea palabras del canal ThingSpeak y compare la distribución de las marcas de tiempo tempranas y tardías.

Leer datos de texto y calcular la frecuencia de palabras

Lea los últimos 500 puntos de datos del canal CheerLights ThingSpeak. Encuentre la frecuencia de las palabras en cada documento de una colección usando la función bagofwords en Text Analytics Toolbox.

colorData = thingSpeakRead(1417,'numPoints',500,'OutputFormat','Timetable','fields', [1]);
bagOfWords(colorData.LastCheerLightsCommand')
ans = 

  bagOfWords with properties:

          Counts: [61 68 40 59 23 42 52 59 40 46 10]
      Vocabulary: [1×11 string]
        NumWords: 11
    NumDocuments: 1

Ordenar resultados por tiempo

Encuentre el índice de cada punto de datos con una marca de tiempo anterior a la hora del almuerzo y luego busque todos los índices de los puntos de datos después del almuerzo. Utilice los índices para crear una matriz de todas las palabras para cada caso.

lateTimeIndex = (hour(colorData.Timestamps) > 12);
earlyTimeIndex = (hour(colorData.Timestamps) < 12);

lateColors = colorData.LastCheerLightsCommand(lateTimeIndex);
earlyColors = colorData.LastCheerLightsCommand(earlyTimeIndex);

Comparar la frecuencia de las palabras en la nube de palabras

Utilice los datos ordenados para generar las nubes de palabras. La función subplot le permite compararlos uno al lado del otro.

subplot(1,2,1);
earlyWordCloud = wordcloud(earlyColors,'Color','blue')
title('Early Morning CheerLights');

subplot(1,2,2);
lateWordCloud = wordcloud(lateColors,'color','green')
title('Late Night CheerLights');
earlyWordCloud = 

  WordCloudChart with properties:

           WordData: [1×11 string]
           SizeData: [67 60 58 58 49 46 42 40 40 22 10]
    MaxDisplayWords: 100

  Use GET to show all properties


lateWordCloud = 

  WordCloudChart with properties:

           WordData: ["cyan"    "magenta"    "red"    "white"]
           SizeData: [1 1 1 1]
    MaxDisplayWords: 100

  Use GET to show all properties

La distribución de colores enviados a CheerLights parece depender sólo ligeramente de la hora del día de la publicación. Algunos colores son fuertes sólo por la tarde y otros son consistentemente fuertes durante todo el día.

Consulte también

(Text Analytics Toolbox) | (Text Analytics Toolbox)

Sitios web externos