0
我試圖從數據框中爲評論ID和業務ID選擇5個評論ID。我認爲它會迭代groupby對象,但這不起作用。如何選擇具有特定ID的元素的隨機樣本
df_b = df.groupby('business_id')
selected = random.sample(df_b,5).review_ids
我試圖從數據框中爲評論ID和業務ID選擇5個評論ID。我認爲它會迭代groupby對象,但這不起作用。如何選擇具有特定ID的元素的隨機樣本
df_b = df.groupby('business_id')
selected = random.sample(df_b,5).review_ids
不確定DataFrameGroupBy
對象是你想要的。我認爲你最好每個id使用DataFrame.sample()
。
frames = list()
for buisness_id in df['business_id'].unique():
frame = df[df['business_id'] == business_id].sample(5)
frames.append(frame)
df = pd.concat(frames)
您可能想給出一個示例數據框,顯示您想要的輸出並解釋您的代碼如何不符合您的期望。 – cel