我在每個包含2個pdf的主文件夾中有3000個子文件夾。 我寫了下面的代碼來轉換文本文件中的PDF。PDF到文本文件的轉換
* all.subfolders < - list.dirs( 「#路徑主文件夾」,full.names = TRUE)
sapply(all.subfolders[-1], function(x) {
file <-list.files(x, full.names=TRUE)
lapply(file, function(x) system(paste('"C:\\Program Files (x86)\\xpdfbin-win-3.03\\bin64\\pdftotext.exe"', paste0('"', x, '"')), wait = FALSE))})*
有
但在幾個PDF文件可能無法在文本轉換,如何讓他們在一個列表左右。 請幫忙。
爲什麼不能轉換這些pdf?你收到錯誤信息了嗎?也許這些PDF文件不包含文本? –
它們包含文本,但我認爲PDF是掃描的文件,因此無法轉換。我dint得到任何錯誤消息。執行命令後,我發現他們轉換的文件在各自的文件夾中。 –