Esta função recebe um data frame em formato "tidy" (um registro por palavra), calcula as frequências e o transforma na estrutura de lista aninhada requerida pela função wordstream().

prepare_wordstream_data(data, time_col, group_col, word_col, top_n = 60)

Arguments

data

Um data frame.

time_col

O nome da coluna (string) que marca o tempo (ex: "Week", "Year").

group_col

O nome da coluna (string) que define a categoria/grupo (ex: "POS", "Topic").

word_col

O nome da coluna (string) que contém as palavras ou termos.

top_n

O número de palavras mais frequentes a serem mantidas para cada grupo em cada período.

Value

Uma lista de listas no formato adequado para a função wordstream.