0
我有690分的句子用500個字自己的術語列表,如何用我自己的術語列表製作文檔術語表?
所以我想使文件項矩陣,如:
我試過在tm
包使用DocumentTermMatrix
,但我無法找到製作矩陣自己的單詞列表的方式。我該怎麼辦?或者你推薦什麼軟件包或功能?
我有690分的句子用500個字自己的術語列表,如何用我自己的術語列表製作文檔術語表?
所以我想使文件項矩陣,如:
我試過在tm
包使用DocumentTermMatrix
,但我無法找到製作矩陣自己的單詞列表的方式。我該怎麼辦?或者你推薦什麼軟件包或功能?
定義您自己的停用詞矢量,然後刪除該矢量中的所有詞條。
基本思想是:
mystopwords <- setdiff(unique(Terms(mydtm)), mywordvect)
mycorpus <- tm_map(mycorpus, removeWords, mystopwords)
(轉換mycorpus到DTM增益...)
你必須找出在細節上你自己。