-1
A
回答
2
TM具有功能stemCompletion()
x <- c("completed","complete","completion","teach","taught")
tm <- Corpus(VectorSource(x))
tm <- tm_map(tm, stemDocument)
inspect(tm)
dictCorpus <- tm
tm <- tm_map(tm, stemDocument)
tm <- tm_map(tm, stripWhitespace, mc.cores=cores)
tm<-tm_map(tm, stemCompletion,dictionary=dictCorpus)
至於完成動詞目前的緊張,我不知道這是可能的TM。也許RWeka,word2vec或qdap將有方法,但我不確定。
一個快速和骯髒的解決方案可能是設置type = shortest
在stemDocument
通常我認爲現在時單詞將比過去式和動名詞短。
相關問題
- 1. R文本分析的拼寫感知詞幹
- 2. 顯示詞幹詞和使用haskell的詞幹分析
- 3. 詞法分析器應該完成哪部分解析?
- 4. 禁用詞幹上查詢分析器
- 5. ElasticSearch - 與詞幹分析器無結果
- 6. 在R中使用基本詞詞根而不是根詞幹
- 7. 在數據幀詞幹文本列有R
- 8. 文化無關的詞幹/分析儀Lucene.NET
- 9. R中的成對分析
- 10. Python中的停止詞消除和詞幹分析器
- 11. DebugDiag未完成分析
- 12. R中的子圖文本分析(igraph)
- 13. 定義 - R的包文本分析
- 14. R中的主成分分析,ggbiplot
- 15. R中的主成分分析
- 16. R詞典在詞典中的情感分析
- 17. [R詞幹砍的話太多
- 18. r中的詞幹:缺失值
- 19. 詞法分析
- 20. 詞法分析
- 21. Xcode flex詞法分析器未生成
- 22. 拆分大文本字符串分成若干小的
- 23. ANTLR:如何用python生成詞法分析器和分析器?
- 24. 詞性分析(POS)標籤文本分類的特徵選擇
- 25. R data.table文本解析
- 26. 新版本應該在版本控制的幹線或分支中完成?
- 27. 帶有詞幹分析器的Lucene熒光筆
- 28. 解析文本文件而不分裂多個詞的名稱
- 29. 使用tm-package進行文本挖掘 - 詞語詞幹
- 30. 未能在VSTS中「完成SonarQube分析」