0
我有一個這樣的數據表。熊貓:創建重複的行,修改某些列
A B1 B2 B3 C
3 1 2 0 'foo'
5 1 4 5 'bar'
7 0 3 0 'baz'
8 0 0 0 'foo'
我想創建一個看起來像這樣一個新的數據表:根據以下規則
A B C
1.5 1 'foo'
1.5 2 'foo'
1.67 1 'bar'
1.67 4 'bar'
1.67 5 'bar'
7 3 'baz'
8 0 'foo'
:
- 如果沒有
B#
列爲零,創建一個A
不變的新行,並且B = 0
。 - 如果
B#
列n >= 1
是零,則創建新n
行,每行A
改爲A/n
和B
等於非零B#
列之一。
C
獨處。我不關心新行的順序。我正在處理的實際數據表是幾十兆字節,所以如果可能的話,我寧願避免不必要的重複複製的解決方案。