我正在使用數據工廠創建暫存區域,問題是無論何時源數據更改,我們都會向臨時表格添加新行。僅保留數據工廠中的最新一行數據
例如,假設我們有如下數據:
ID Fields created edited
100 ---------- '2017-07-01' '2017-07-05'
這將被儲存在我們的臨時表是這樣的:
ID Fields created edited
100 ---------- '2017-07-01' null
100 ---------- '2017-07-01' '2017-07-05'
選擇最近的一排是昂貴的,我們不」我想要那個。您如何認爲我們可以避免在分期中存儲重複的ID?
我假設在創建管道時,如果ID已經存在於分段中,應該有一種方法來更新數據。
在數據工廠的查詢格式是這樣的:
$$Text.Format('select * from <<table>> where <<column>> >= \'{0:yyyy-MM-dd HH:mm}\' AND <<column>> < \'{1:yyyy-MM-dd HH:mm}\'', WindowStart, WindowEnd)
你可以做一個MERGE類似[this]的東西(https://docs.microsoft.com/en-us/azure/data-factory/data-factory-invoke-stored-procedure-from-copy-活動)? – wBob
如果存在(從表中選擇1,其中id = @ id)update statement where id = @ id else insert語句 – JayaPrakash