我有以下格式的數據 -R中轉換分組行數據爲列
ID EVID ADMIT DC DRG CLIN_C PRIN_DX
1 AA 1/1/13 2/1/13 ABC 1A234 Y
1 AA 1/1/13 2/1/13 ABC 1B345 N
1 AA 1/1/13 2/1/13 ABC 1C234 N
1 AA 1/1/13 2/1/13 ABC 1234C N
1 BB 3/1/13 2/15/13 EEE C12C3 Y
1 BB 3/1/13 2/15/13 EEE 1B345 N
1 BB 3/1/13 2/15/13 EEE 1C234 N
1 BB 3/1/13 2/15/13 EEE 987D N
2 CC 3/1/13 2/15/13 EEE C12C3 Y
2 CC 3/1/13 2/15/13 EEE 546X N
2 CC 3/1/13 2/15/13 EEE 1C234 N
2 CC 3/1/13 2/15/13 EEE 1234C N
而且我想在下面的格式的數據:
ID EVID ADMIT DC DRG PRIN_DX 1B345 1C234 1234C 987D 546X
1 AA 1/1/13 2/1/13 ABC 1A234 1 1 1 0 0
1 BB 3/1/13 2/15/13 EEE C12C3 1 1 0 1 0
2 CC 3/1/13 2/15/13 EEE C12C3 0 1 0 0 1
我想做到這一點與R,如果可能的話。我已經嘗試了reshape/reshape2,但找不到處理分組行的明顯方法 - 將分組的行拆分成列,然後聚合剩餘的行。
數據是幾百家醫院入院的記錄 - 如此合理的大。
目前還不清楚(對我)有什麼被聚合的,什麼是不是......它看起來也像是'PRIN_DX'並不代表相同的數據類型長格式,如寬格式。我的第一個想法是,你可能想要這樣的東西:'library(reshape2); dcast(ID + EVID + ADMIT + DC + DRG〜CLIN_C,data = x)' – Chase
列ID,EVID,ADMIT,DC,DRG都應該被聚合 - 這個數據對於給定的許可是相同的。 CLINC_C是臨牀代碼,用於識別在入院期間分配的所有診斷 - 可以分配1至20個。 PRIN_DX識別錄取過程中的原則診斷。我希望將CLIN_C轉換爲每次錄取事件的獨立列,但如果可能的話,請確定原則性診斷。只有聚合和行到列纔會感到滿意 – Matthew