0
給定兩個數據幀,對於第一個數據幀中的每一行,找到相同的行product_id
,但visiting_time
較大,且visting時間間隔兩排最小。R:從兩個數據幀中匹配最小時間間隔的行
例如
cart_add_data的2行與的purchase_data
第一行匹配。
順便說一句,計算效率也很重要。
數據幀:cart_add_data
visting_time product_id
1 2012-01-08 13:29:39 878435
2 2012-01-08 13:36:52 122100
3 2012-01-08 13:38:47 150473
4 2012-01-14 21:06:36 169403
5 2012-01-14 21:06:36 137092
數據幀:purchase_data
visting_time product_id
1 2012-01-08 13:42:35 122100
2 2012-01-08 13:42:35 138857
3 2012-01-08 13:42:35 150473
4 2012-01-18 22:15:04 140376
5 2012-02-02 09:21:28 130437
什麼是門檻? – akrun
沒有閾值,如果有多個匹配的行,只保留具有最小時間間隔的行。如果只有一個匹配的行,則保留它。 – user3237142