0
我有一個日誌的用戶交互與網站:熊貓:訪問下一行(如鉛對Oracle)
id user_id action_type comment timestamp
並非所有ACTION_TYPE可相同。他們中的一些更重要的,有些則少:
PURCHASE (important, primary)
VISIT_PAGE (less important, secondary)
我想我的表格轉換爲以下幾點:
id user_id action_type comment timestamp next_id goal_id
其中:
NEXT_ID是下一個針對未來最接近時間戳的用戶採取的行動
goal_id在未來
例如下一主要動作與最接近的時間戳的用戶,如果用戶有以下病史:
/ -> /toys -> /toys/lego -> /toys/lego/ABC001 -> PURCHASE
然後,我有如下表:
id user_id action_type comment timestamp next_id goal_id
1 1 VISIT_PAGE / 123456789 2 5
2 1 VISIT_PAGE /toys 123457789 3 5
3 1 VISIT_PAGE /toys/lego 123458889 4 5
4 1 VISIT_PAGE /toys/lego/ABC001 123459889 5 5
5 1 PURCHASE 123460889 NULL 5
這可以使用熊貓完成嗎?這與Oracle中的LEAD功能非常相似。
'pandas.Series.shift' –