我正在使用循環神經網絡來消耗時間序列事件(點擊流)。我的數據需要格式化,每行包含一個id的所有事件。我的數據是一種熱門編碼,我已經通過id對它進行了分組。此外,我還會限制每個事件(例如2)的事件總數,因此總是知道最終寬度(#one-hot cols x #events)。我需要維護事件的順序,因爲它們是按時間排序的。將多個時間序列行與Pandas結合成一行
當前數據狀態:
id page.A page.B page.C
0 001 0 1 0
1 001 1 0 0
2 002 0 0 1
3 002 1 0 0
所需的數據狀態:
id page.A1 page.B1 page.C1 page.A2 page.B2 page.C2
0 001 0 1 0 1 0 0
1 002 0 0 1 1 0 1
這看起來像一個pivot
問題給我,但我得到的dataframes不是我需要的格式。我應該如何處理這個問題的任何建議?