我在R中具有以下數據幀。它代表爲便於解釋而組成的蛋白質結構。如何在獲取某些列的最小值和最大值的同時摺疊R中的矩陣
Uniprots Chain resSeq Serial
P68871 D 23 3446
P68871 D 24 3453
P68871 D 25 3457
P68871 D 26 3461
P68871 D 27 3470
P69011 A 38 3561
P69011 A 39 3568
P69011 A 40 3577
P69011 A 41 3588
P69011 A 42 3599
P69011 A 43 3610
P69011 A 44 3619
P69011 A 45 3625
P69011 A 46 3636
P0116 B 2 4239
P0116 B 4 4242
P0116 B 5 4268
P0116 B 6 4279
P0116 B 7 4285
P0116 B 8 4299
P0116 B 9 5015
P0116 C 15 5055
P0116 C 30 5199
P0116 C 42 5239
我要的是坍塌下來,所以它看起來是這樣的:
Uniprot Chain resSeq_start resSeq_end Serial_start Serial_end
P68871 D 23 27 3446 3470
P69011 A 38 46 3561 3636
P0116 B 2 9 4239 5015
P0116 C 15 42 5055 5239
基本上,我要崩潰了下來在第一1,2和3列。然後我可以使用第四列作爲檢查工作。我認爲我可以用聚合做到這一點,但似乎並不奏效。我可以肯定地做一些亂七八糟的循環(繼續追加到一個新的uniprot /鏈向量),但這是醜陋的。
有一點要注意的是,Uniprot/Chain組合並不總是唯一的。具體來說,一個uniprot可以有多個鏈(如我的例子)。
謝謝你的幫助!
應該是min(x $ resSeq)還是類似的? – user1357015