我有大約3百萬行的數據集和結構如下列:最快的方式重塑變量值
PatientID| Year | PrimaryConditionGroup
---------------------------------------
1 | Y1 | TRAUMA
1 | Y1 | PREGNANCY
2 | Y2 | SEIZURE
3 | Y1 | TRAUMA
是相當新的,以R,我有一些很難找到重塑數據的正確方法到結構概述如下:
PatientID| Year | TRAUMA | PREGNANCY | SEIZURE
----------------------------------------------
1 | Y1 | 1 | 1 | 0
2 | Y2 | 0 | 0 | 1
3 | Y1 | 1 | 0 | 1
我的問題是:什麼是最快/最優雅的方式來創建一個data.frame,其中PrimaryConditionGroup值變爲列,由PatientID和年分組(計數數量出現次數)?
+1'ddply'的輸入方式不會太少,實際上它會慢很多。 – joran
爲什麼你甚至會考慮ddply這個問題? – hadley
嗨喬希,謝謝,這個按預期工作,表現很好。什麼是重塑數據的最簡潔/慣用的方式(如果性能不是問題) – Matt