對於qdap來說,這是相當新穎的,但我不確定此功能是否存在,但具有如下所述的功能會很棒。 我的初始數據集。 ID Keywords
1 112 mills, open heart surgery, great, great job
2 Ausie, open, heart out
3 opened, heartily, 56mg)_job, orders12
4 ord
我有一些文本數據的DF,例如, words <- data.frame(terms = c("qhick brown fox",
"tom dick harry",
"cats dgs",
"qhick black fox"))
我已經能夠基於包含拼寫錯誤的任何行子集: library(qdap)
words[check