其實我正在爲郵輪公司做評論分析。我不能告訴你整個程序,因爲它很長,但至少是一個快照。我把所有的評論,分成幾個句子,然後從評論中提取一些短語......例如, '美妙的小屋','優質的服務'。現在爲了情感分析,我必須將該短語的所有名詞映射到特定的主題。現在在那個映射中,我需要所有名詞的同義詞和所有關於這個詞的詞語。所以我的文本挖掘的最終結果將會更加高效。我想你對我正在做的事情有一點點想法。 我會重複我的問題..在Excel中我有一行單詞或說名詞..當我運行代碼[R,VBA或任何]它應該給我與這些單詞有關的所有單詞.. [我提取同義詞與vba代碼]。 希望你明白了..?創建詞的其他形式[名詞,形容詞,複數,動詞..一切]
-2
A
回答
4
您可以使用包tm
及其詞幹功能。
如果你的文本文件是
text <- c("taste", "tastes", "tasting")
您可以創建一個文集
corpus <- Corpus(VectorSource(text)
然後有腦幹功能剝離的話他們的根。 (助手功能避免了一些問題。)
stemDocumentfix <- function(x){ # put in business code
PlainTextDocument(paste(stemDocument(unlist(strsplit(as.character(x), " "))), collapse=' '))
}
corpus <- tm_map(corpus, stemDocumentfix)
inspect(corpus)
<<VCorpus (documents: 3, metadata (corpus/indexed): 0/0)>>
[[1]]
<<PlainTextDocument (metadata: 7)>>
tast
[[2]]
<<PlainTextDocument (metadata: 7)>>
tast
[[3]]
<<PlainTextDocument (metadata: 7)>>
tast
您也可以看看qdap
包,它提供了一系列的功能,用於文本挖掘。
相關問題
- 1. 名詞/形容詞/其他詞典或詞典(普通詞)
- 2. 動詞/名詞/形容詞形式之間的單詞轉換
- 3. 單詞的名詞,動詞,形容詞等的單獨列表
- 4. 將形容詞和副詞轉換爲名詞形式
- 5. 名詞,動詞,形容詞等的單詞列表
- 6. 將單詞識別爲名詞,動詞或形容詞
- 7. 在Java中將單詞轉換成他們的名詞/形容詞/動詞形式
- 8. 如何分別獲取名詞,動詞,形容詞synset?
- 9. 爲副詞和形容詞獲取相應的動詞和名詞
- 10. SQL名詞複數形式的函數
- 11. 如何識別形容詞或副詞?
- 12. 形容詞功能
- 13. Perl模塊查找單詞是否是動詞/名詞/形容詞/文章/介詞
- 14. 如何從棕色語料庫中獲得動詞,名詞,形容詞?
- 15. 應該如何創建Rails控制器?它應該是動詞,名詞還是形容詞?
- 16. 如何命名爲形容詞或介詞的Rails資源?
- 17. Python:NLTK中的形容詞Synsets
- 18. 從WordNet獲取名詞和形容詞列表
- 19. POS標記 - NLTK認爲名詞是形容詞
- 20. Ruby on Rails - 添加隨機形容詞+名詞
- 21. 爲「High Score」建議的動詞/名詞
- 22. 從動詞獲取名詞詞網
- 23. 從名詞詞組獲得動詞python
- 24. 詞形化java
- 25. 詞頻圖形
- 26. 在nltk或其他NLP庫中從副詞中獲取形容詞
- 27. 非英語單詞的詞形化?
- 28. 單詞列表的詞形化
- 29. 名詞同義詞詞網
- 30. 接口命名爲形容詞
嗯這樣的字典用例是什麼?也許把詞彙轉換成一個共同的根源是另一種選擇。如果沒有,你應該看看像[WordNet]這樣的數據庫(http://en.wikipedia.org/wiki/WordNet)。無論如何,這個問題可能太廣泛了。 – lukeA 2015-02-11 11:20:59
我不知道R綁定,但看到https://www.nodebox.net/code/index.php/Linguistics - verb.infinitive()/ present_participle() - 他們採取的方法記錄 – 2015-02-11 11:27:16
@Roland:可以一個OP接受對暫緩問題的回答? – lawyeR 2015-02-11 13:28:44