我有一個數據幀,它是日期索引(d-m-y)。我想創建一個二進制特性列,表示日期是否是本月的第二個星期六。
到目前爲止,我已經得到了這是什麼:在日期索引熊貓數據幀中標記某些日期
def get_second_true(x):
second = None
for index, is_true in enumerate(x):
if is_true and second is None:
return index
if is_true and second is not None:
second = True
second_saturdays = df.groupby(['month', 'year']).apply(
lambda x: x.index.weekday == 6
).apply(get_second_true)
我無法把它恢復成一系列它涉及到原來的數據幀的指數以這樣的方式,每行都有一個標籤,無論是是否是第二個星期六。
這感覺就像一個常見的情景,但我無法找到用於做這種事情的術語。我看過unstack
和reset_index
,但我不明白他們是否有足夠的深度來了解是否可以使用它們,或者甚至需要多級索引。
我認爲R社區可能知道這是什麼,因爲數據幀在那裏很安靜。 – theSage