2016-12-06 40 views
0

我使用代碼來檢查我的數據集'df'並查看'Has_Arrears'列中的嚴重不平衡。我會用Has_Arrears = 1 35倍的重複樣本展開我的目標數據集。即每個觀察Has_Arrears = 1的樣本35次。我如何實現這一點?歡呼聲複製數據集中的樣本?

如果我想使用stratify抽樣,我該如何編碼?

enter image description here

+0

很難告訴你,在這個問題想要什麼。你需要你的代碼返回什麼樣的對象?它是代表Has_Arrears == 1的過採樣行的索引數組嗎? – kiliantics

回答

0

如果我理解正確的話,這可能是你在找什麼:

new = df['Has_Arrears'] == 1 
a = df[new] 
df = df.append([a]*35, ignore_index=True) 
相關問題