我嘗試使用tidyverse(http://tidyverse.org/)分析德語句子列表。我堅持這個指南(http://tidytextmining.com/)。R:在逆向中使用德語停用詞,但防加入不起作用
當我嘗試使用德語停用詞表時,它不起作用。
library(tidyverse)
library(readxl) # read excel
library(tibble) # tobble dataframe
library(dplyr) # piping
library(stringr) # character manipulation
library(tidytext)
library(tokenizers)
data <- read_xlsx("C:/R/npsfeedback.xlsx", sheet = "Tabelle1", col_names="feedback")
data
is.tibble(data)
# tokenise
data_clean <- data %>%
na.omit() %>%
unnest_tokens(word,feedback)
這也部分造成我的麻煩:
# remove stopwords
sw <- tibble(stopwords("de"))
sw
data_clean <- data_clean %>%
anti_join(.,sw)
我topwords是與一列字符類型tibble。 但是,如果我嘗試使用anti_join我得到這樣的輸出:
Error: `by` required, because the data sources have no common variables
你知道我有什麼關係?