讓說,我有交易數據和訪問數據火花流數據的銜接VS歷史數據
visit
| userId | Visit source | Timestamp |
| A | google ads | 1 |
| A | facebook ads | 2 |
transaction
| userId | total price | timestamp |
| A | 100 | 248384 |
| B | 200 | 43298739 |
我想加入的交易數據和訪問數據,做銷售的歸屬。我希望在事務發生時(流式傳輸)實時進行。
在spark中使用連接函數可以在一個數據和非常大的歷史數據之間進行連接嗎? 歷史數據是訪問,因爲訪問可以隨時(例如訪問是在交易發生前一年)
您的交易數據多久更新一次? –
交易數據將被實時處理。如果你的意思是記錄,它永遠不會更新(最終交易) – rendybjunior
對不起。 Meant更新爲添加記錄時未更新的記錄。 –