遍歷目錄得到的Excel內容

2013-02-28 72 views 2 likes

sites=list.files(pattern='[.]xls') 
> sites 
[1] "test1.xls" "test2.xls" "test3.xls"

這工作：

a=read.xlsx(sites[1],14)

所以我希望這將工作太：

df=data.frame() 
    for (i in sites){ 
    x=read.xlsx(sites[i],14) 
    x=x[560:831,12:14] 
    df=rbind.fill(df,x) 
    }

但是，這給出：

Error in loadWorkbook(file) : Cannot find NA

這裏怎麼回事？另外，有沒有一種方法來實現這一點 - 文件很大，加載速度很慢;我無法使用read.xlsx2，因爲數據不是以正確的[表格]格式。

來源

2013-02-28 Henk

爲什麼不把你的文件保存爲csv並用read.delim或read.csv讀取它們？你不能對此進行矢量化。但是你可以使用'data.table'中的'rbindlist'來加速行綁定。看到[這]（http://stackoverflow.com/questions/15102499/loading-multiple-files-into-matrix-using-r/15102639#15102639） – agstudy 2013-02-28 07:50:41

問題是，有幾百個Excel文件[例子這裏給出的只有3]，所以是的，將它們轉換爲csv會更容易，更快。 – Henk 2013-02-28 10:37:08

回答

您的i重複遍歷sites的元素而不是索引。改爲嘗試for(i in 1:length(sites))。或者x=read.xlsx(i,14)。

來源

2013-02-28 07:47:09

您可以嘗試使用plyr軟件包中的ldply。

我首先定義了一個函數，因爲您只想取每個文件的一部分。如果你全部使用它，你可以在ldply調用中使用read.xlsx。

library(xlsx) 
library(plyr) 
sites=list.files(pattern='[.]xls') 

fun <- function(x) { 
    df <- read.xlsx(x, sheetIndex=14) 
    df <- df[560:831,12:14] 
}

然後在ldply使用fun：

df.big <- ldply(sites, fun)

這應該給你所有你的牀單合併的數據幀。

來源

2013-02-28 08:08:20 alexwhan

優秀！這工作。 – Henk 2013-02-28 11:58:21

相關問題

11. perl的遍歷目錄
12. 遍歷兩個目錄
13. 用php遍歷目錄？
14. 目錄遍歷問題c＃
15. 使用Node.js遍歷目錄
16. 遍歷目錄路徑
17. 通過http遍歷目錄
18. 目錄遍歷bash shell
19. 遞歸目錄遍歷
20. Perl子目錄遍歷
21. 目錄遍歷攻擊
22. 用Gulp遍歷目錄？
23. 遍歷目錄使用Java
24. Unix：遍歷一個目錄
25. 笨 - 目錄遍歷 - sanitize_filename（）
26. 到達目錄時的目錄遍歷方法
27. 的Python /遍歷subprocess.check_output的內容 - 逐行
28. 如何遍歷目錄和cd到每個目錄
29. 腳本遍歷目錄和子目錄到列表文件
30. 遍歷Excel範圍