2
我有一個數據幀,大小N.我需要其中N < S.如何使用替換對熊貓DataFrame進行採樣?
def sampleDF(df, K):
return df.ix[np.random.randint(0, len(df), size=k)]
我返回一個新的DF但似乎一切都充滿了NaN的帶S的樣品來樣呢,與更換。我不確定發生了什麼事!
我有一個數據幀,大小N.我需要其中N < S.如何使用替換對熊貓DataFrame進行採樣?
def sampleDF(df, K):
return df.ix[np.random.randint(0, len(df), size=k)]
我返回一個新的DF但似乎一切都充滿了NaN的帶S的樣品來樣呢,與更換。我不確定發生了什麼事!
使用iloc[]
:
df.iloc[np.random.randint(0, len(df), size=k)]
作品完美!你是否介意我問爲什麼ix不起作用 - 看起來它在較小的樣本中,但不在5k行的那些樣本中。 – redrubia
這裏是文檔:http://pandas.pydata.org/pandas-docs/dev/indexing。 HTML#不同,選擇換索引-LOC-ILOC和-IX – HYRY