我的工作進展得順利的時候,但我遇到由於一些含有怪異的符號我的PDF文件的問題(「DY「§」) 我審查了更早的討論,但沒有這些解決方案的工作: R tm package invalid input in 'utf8towcs' 這是到目前爲止我的代碼: setwd("E:/OneDrive/Thesis/Received comments document/Consultation 50")
ge
我有一個列表,我試圖通過添加在一起的n個文檔,以便它們形成一個單獨的VCorpus。通常情況下,您可以使用c()運算符並加入兩個VCorpus來創建一個更大的運算符。但是,如果我按照下面的方法首先初始化列表,則會將語料庫轉換爲字符列表。但如果我不初始化它,我會收到一個錯誤。 clean_corpus <- c()
for (i in directory_source$filelist)