2015-11-11 42 views
0

我試圖從數據框中爲評論ID和業務ID選擇5個評論ID。我認爲它會迭代groupby對象,但這不起作用。如何選擇具有特定ID的元素的隨機樣本

df_b = df.groupby('business_id') 
selected = random.sample(df_b,5).review_ids 
+2

您可能想給出一個示例數據框,顯示您想要的輸出並解釋您的代碼如何不符合您的期望。 – cel

回答

0

不確定DataFrameGroupBy對象是你想要的。我認爲你最好每個id使用DataFrame.sample()

frames = list() 
for buisness_id in df['business_id'].unique(): 
    frame = df[df['business_id'] == business_id].sample(5) 
    frames.append(frame) 

df = pd.concat(frames) 
相關問題