2
我將通過實際案例:[R詞幹砍的話太多
library(data.table)
dt <- data.table(words = c("finance", "financial", "business"),
freq = c(123, 5, 4589))
dt <- dt[, words := SnowballC::wordStem(words, language = "english")]
View(dt)
words freq
financ 123
financi 5
busi 4589
我想詞幹會給我財政,金融和商業。 我至少希望財務和財務有相同的基本詞。 即時通訊組試圖分組類似的單詞,它適用於有一些詞有和已成爲 有,但對於一些像上述它似乎工作,除非我誤解?