2
我與具有以下結構的大數據幀列工作:如何創建一個唯一的ID列給定一個有序的數值序列?
在:
df1 = pd.DataFrame({'A': [0,0,0,1,2,0,1,0,1,2,3,4,5,6,7]})
日期:
A
0 0
1 0
2 0
3 1
4 2
5 0
6 1
7 0
8 1
9 2
10 3
11 4
12 5
13 6
14 7
正如你所看到的,A
是從0到一個有序序列ñ。這代表我的數據中的一個訂單。例如:
A
2 0
3 1
4 2
5 0
讓我們的df1
(從索引2
到5
)塊,在A
列中的0
代表開始和2
表示序列結束。另一方面,如果沒有連續的號碼(例如0
),則表示該序列結束。因此,我的問題是如何有效地生成由設在的A
的數值順序的唯一鍵或數字符合新的一列(例如id
):
A id
0 0 -> begin and ends 1
1 0 -> begin and ends 2
2 0 -> begin 3
3 1 -> continue 3
4 2 -> ends 3
5 0 -> begin 4
6 1 -> ends 4
7 0 -> begin 5
8 1 -> continue 5
9 2 -> continue 5
10 3 -> continue 5
11 4 -> continue 5
12 5 -> continue 5
13 6 -> continue 5
14 7 -> ends 5
我爲了更清楚加入的圖。
神聖的狗屎......我正在使用iter(),接下來,如果循環....這是驚人的。你可以提供一個解釋嗎?... –
雅,給我一秒 – jezrael
非常感謝你 –