2017-10-10 67 views
-1

我正在使用RStudio版本1.0.153。R/R工作室:PDF文件的迭代文件夾和轉換爲R對象

我有一個大約30個PDF文件夾。我想將它們轉換爲R中的各個對象作爲字符串。我已經有pdftools包,它已成功轉換爲對象,我只是尋找一種方式讓它迭代地瀏覽一個文件夾中的PDF列表,以自動分配給它各自的變量。

例如,如果我有30個pdf,命名爲「P1.pdf,P2.pdf,P3.pdf .... P30.pdf」,我如何讓R將它們全部轉換爲使用pdftools的文本,以便它們是他們各自的R對象,稱爲P1,P2,P3 ...... P3?

謝謝了。

我一直在這裏學習這麼多!

米拉

+0

您是否嘗試過自己什麼?請查看[this](https://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example)並考慮編輯您的問題以反映其他信息。一般來說,這裏的人們希望提出一些問題以表明一些努力,因爲該網站不打算爲需要幫助的人編寫代碼。 – shea

+0

我是初學者,我嘗試了一些東西,我顯然是新手。我沒有發佈這個,讓有人爲我寫代碼,你的評論在這方面很冒昧。我仍然無法弄清楚如何編寫迭代代碼並尋求幫助。 – MeeraWhy

+0

我不假設任何東西,這就是爲什麼我問你做了什麼。很多新用戶都會看到「Welcome to SO」,請閱讀<我的第一條評論中包含的鏈接>。我的第一條評論與第一次使用其他更有經驗的用戶的第一次評論沒有什麼不同,我沒有downvote你的問題,其他人把它投下來,可能是因爲我在評論中指出了我的意見,我的意見是建設性的,對不起,你沒有這樣做,如果你顯示你的嘗試工作,有人可以指出在哪裏你需要幫助並提出改進建議 – shea

回答

-1

這可能工作:

pdf_operations <- function{ 
... #using whatever operations you may have 
} 

fnames <- dir(".//PDF Files/", pattern = "\\.pdf") 
sapply(fnames, pdf_operations) 
+0

爲什麼OP必須創建一個新的自定義函數?你看看pdftools具有哪些函數? – shea

+0

如果他們想要將一些數據保存到一個單獨的文件中(圖像或其他pdf),提取一些信息,將其傳遞給另一個函數進行清理(比如對於表數據 - 哪些pdf沒有單獨的格式),或者只是想以某種方式命名對象。提供最廣泛的解決方案t將涵蓋所有上述內容。 – Gautam

+0

你不知道OP在做什麼,所以只是寫一個答案並希望這是正確的答案是回答問題的錯誤方法。我嘗試了你的解決方案,從我所知道的情況來看,這是行不通的。這可能是因爲你不知道實際功能是什麼以及它應該做什麼。 – shea