如果你有一隻熊貓DataFrame({'a':[1,2,3,4,5,6,7,8,9]})
有沒有簡單的方法將它分組爲3個或任意數量的組?熊貓數據框組由多行
我知道這可以通過添加一個包含允許分組的值的額外列來完成,例如,您可以將上述數據框加入[1,1,1,2,2,2,3,3,3]
,並通過添加列加入group。但似乎應該不需要爲此操作添加額外的列。
另外,我可以創建一個索引數組並循環使用它們作爲DataFrame.ix []的參數的數組值,但對於大型DataFrame而言似乎並不快。
我錯過了一個更簡單的方法嗎?
== ==方案
從下面我的首選解決方案的答案是使用numpy.array_split(如果一個不平等分工不同numpy.split使它不會引發異常),您還可以通過要分割的索引數組而不是所需的結果數量。與線下面你可以分割一個數據幀(DF)爲x行
split_df = np.array_split(df, np.arange(0, len(df),x))
的split_df小DataFrames是一個列表,其中所述第一對象是一個空numpy的陣列與以下對象是分裂DataFrames。
謝謝,我之前沒有注意到np.split。 – seumas 2013-03-13 09:42:08