2016-03-26 23 views
0

我必須對超過100個.txt文件運行關聯分析。我有一個腳本讀取單個文件,以我需要的適當方式組織數據,然後將相關值存儲爲新變量。該腳本非常大,因爲數據被重新格式化了很多。在.txt文件上多次運行腳本並將每個輸出保存在單個表中

我的問題。我怎樣才能讓這個腳本在所有100個以上的.txt文件中重複運行,並將所有100+的單個相關值存儲在一個DF中?理想情況下,最終的DF將包含兩列,一列具有.txt ID,另一列具有相關係數,並且它將具有100多行。

我可以從字面上將腳本複製並粘貼到for循環中嗎?如果是這樣會怎麼樣?我是一個新手! 任何想法? 謝謝!

+1

使用'lapply'在多個文件上運行。 – akrun

回答

2

由於akrun提到,你可以用lapply來做到這一點。沒有看到你的數據,我建議是這樣的:

my.files <- list.files(pattern = "txt") # use a pattern that only matches the files you want to read in 
output <- lapply(my.files, correlation_function) 

# Combine list of outputs into a single data.frame 
output.df <- do.call(rbind, output) 

這是假設你有一個名爲correlation_function函數,接受文件名作爲輸入,load s文件到R,運行相關性分析,並返回一個data.frame

+0

謝謝!我會試一試! –

相關問題