2016-08-02 83 views

回答

0

定義您自己的停用詞矢量,然後刪除該矢量中的所有詞條。

基本思想是:

mystopwords <- setdiff(unique(Terms(mydtm)), mywordvect) 

mycorpus <- tm_map(mycorpus, removeWords, mystopwords) 

(轉換mycorpus到DTM增益...)

你必須找出在細節上你自己。