0
我在R學習文本挖掘並取得了相當不錯的成功。但我堅持如何處理複數。即我希望將「民族」和「民族」統一爲同一個詞,理想的情況下將「詞典」和「詞典」統一爲同一個詞。R文本挖掘 - 處理複數
x <- '"nation" and "nations" to be counted as the same word and ideally "dictionary" and "dictionaries" to be counted as the same word.'
當問上SO一個問題,你被要求提供(1)樣本數據;(2)使用的是包的列表,( 3)別人可以複製和粘貼的代碼來重現您的問題。 – 2016-01-22 02:34:42
看看這個由Bob Rudis編寫的GitHub軟件包(@hrbrmstr)https://github.com/hrbrmstr/pluralize –
'SnowballC :: wordStem'可能在這裏有用處。 –