如何選擇具有特定ID的元素的隨機樣本

我試圖從數據框中爲評論ID和業務ID選擇5個評論ID。我認爲它會迭代groupby對象，但這不起作用。如何選擇具有特定ID的元素的隨機樣本

df_b = df.groupby('business_id') 
selected = random.sample(df_b,5).review_ids

來源

2015-11-11 dana111

您可能想給出一個示例數據框，顯示您想要的輸出並解釋您的代碼如何不符合您的期望。 – cel

不確定DataFrameGroupBy對象是你想要的。我認爲你最好每個id使用DataFrame.sample()。

frames = list() 
for buisness_id in df['business_id'].unique(): 
    frame = df[df['business_id'] == business_id].sample(5) 
    frames.append(frame) 

df = pd.concat(frames)

來源

2015-11-11 21:48:13 Batman

如何選擇具有特定ID的元素的隨機樣本

回答

相關問題