-1
在以下代碼中,任何匹配「/ | @ | \ |」的字符將被更改爲空格。r:需要由tm_map()調用的content_transformer()將非字母更改爲空格
> library(tm)
> toSpace <- content_transformer(function(x, pattern) gsub(pattern, " ", x))
> docs <- tm_map(docs, toSpace, "/|@| \\|")
什麼代碼會將所有非字母轉換爲空格? (什麼地方的xxxxx的下面。)
這是非常困難的所有非字母在一個字符串...(非常長的名單,一些不可打印的,加上逃避字符的東西。)所以,我正在做與上述相反的事情。
> toSpace_2 <- content_transformer(function xxxxxxxxxxxxxxxxxxxxxxx))
> docs <- tm_map(docs, toSpace_2, "a|b|c|d|e|f|g|h|i|j|k|l|m|n|o|p|q|r|s|t|u|v|w|x|y|z")
|這需要通過content_transformer()函數來完成,以保持文檔的完整性。
感謝
重複[r:需要內容\ _transformer()調用tm \ _map()將非字母更改爲空格](http://stackoverflow.com/questions/29834397/r-need-content-transformer-所謂按TM-MAP到變化的非字母 - 空) –