2015-04-23 44 views
-1

在以下代碼中,任何匹配「/ | @ | \ |」的字符將被更改爲空格。r:需要由tm_map()調用的content_transformer()將非字母更改爲空格

> library(tm) 
> toSpace <- content_transformer(function(x, pattern) gsub(pattern, " ", x)) 
> docs <- tm_map(docs, toSpace, "/|@| \\|") 

什麼代碼會將所有非字母轉換爲空格? (什麼地方的xxxxx的下面。)

這是非常困難的所有非字母在一個字符串...(非常長的名單,一些不可打印的,加上逃避字符的東西。)所以,我正在做與上述相反的事情。

> toSpace_2 <- content_transformer(function xxxxxxxxxxxxxxxxxxxxxxx)) 
> docs <- tm_map(docs, toSpace_2, "a|b|c|d|e|f|g|h|i|j|k|l|m|n|o|p|q|r|s|t|u|v|w|x|y|z") 

|這需要通過content_transformer()函數來完成,以保持文檔的完整性。

感謝

+0

重複[r:需要內容\ _transformer()調用tm \ _map()將非字母更改爲空格](http://stackoverflow.com/questions/29834397/r-need-content-transformer-所謂按TM-MAP到變化的非字母 - 空) –

回答

相關問題