我使用R來分析一個具有100,000行左右的CSV文件,看起來像這樣。我會很感激任何幫助 - 我真的很新鮮。將數據行添加到數據幀中,以確保每個唯一值有n次重複?
這是我的表:
Row1 -> Group, Position, Frequency
Row2 -> 192, 1, 0.2
Row3 -> 192, 2, 0.3
Row4 -> 192, 3, 0.1
Row5 -> 193, 4, 0.5
Row6 -> 193, 5, 0.6
Row7 -> 194, 6, 0.2
Row8 -> 194, 7, 0.4
Row9 -> 195, 8, 0.9
Row10 -> 196, 9, 0.8
我想在組列的每個值重複正好三次。 192次重複三次,但是194次重複兩次,而195和196只出現一次。我想添加行,如果在組列中沒有三次重複值,它將添加行以使總共三次重複,並將該行的其他列中的單元保留爲空(或NA
)。所以,最終的結果是這樣的:
Row1 -> Group, Position, Frequency
Row2 -> 192, 1, 0.2
Row3 -> 192, 2, 0.3
Row4 -> 192, 3, 0.1
Row5 -> 193, 4, 0.5
Row6 -> 193, 5, 0.6
Row7 -> 193, NA, NA
Row8 -> 194, 6, 0.2
Row9 -> 194, 7, 0.4
Row10-> 194, NA, NA
Row11 -> 195, 8, 0.9
Row12 -> 195, NA, NA
Row13 -> 195, NA, NA
Row14 -> 196, 9, 0.8
Row15 -> 196, NA, NA
Row16 -> 196, NA, NA
謝謝你這麼多! –