我工作的一個項目,我有很多的分析家創造R.統計模型的他們通常提供給我的模型對象(.Rdata文件)和我自動執行它們的各種數據集。序列化.RData文件數據庫
我的問題是:
我可以使用一個數據庫,並有保存這些文件.RData?任何暗示這樣做? (我目前將.Rdata文件存儲到磁盤並使用數據庫存儲位置信息)
我從其他分析師那裏得到很多R腳本,他們在創建模型之前對數據進行了一些預處理。有沒有人有使用PMML的經驗,使這個過程可重複無需人工干預? PMML將預處理步驟,建模步驟存儲爲標記標記,並將在新數據集上重複相同步驟。
感謝您的建議和反饋。
-Harsh
即使斑點不支持,你可以序列化/反序列化,並從ASCII(因爲你甚至在你的例子一樣),然後保存ASCII字符串。 – 2010-10-17 23:23:14
我以爲我這麼說?我說錯了嗎? – 2010-10-17 23:25:23
注意,ASCII序列obj爲16K字節大(長(OBJ)),二進制版本是11K字節大,但如果保存(「TT」,文件=「tt.RData」),你得到的東西只有5K大。 – Spacedman 2010-10-18 07:41:17