2014-11-05 53 views
4

我是新與R軟件現在R-無效的多字節字符串1

,採用「以舊換新」包」

我有映射文本ploblem爲小寫

sms_raw<-read.csv(............) 
sms_corpus<-Corpus(VectorSource(sms_raw$text)) 
sms_corpus<-Corpus(VectorSource(sms_raw$text)) 
tm_map(sms_corpus,content_transformer(tolower)) 
error:invalid multubytes string 1 
研究文本挖掘

我想我的csv文件可能是不支持UTF-8,所以我恢復爲UTF-8,但沒有奏效。

我的操作系統是win8.1

任何人都有這個問題的解決方案,請讓我知道。

+0

請提供一個可重複使用的小例子,說明進度停止的位置。 – 2014-11-05 09:00:32

回答

14

的錯誤我已經很容易地通過編碼功能

解決了我的文件的列,其名稱爲文本包含多字節字符

所以我鍵入

這個命令轉換的「文本」列(多字節)轉換爲utf8格式

相關問題