我有導入到Google Big Query中的表格。 這些表是我的登臺表,我使用視圖將登臺錶轉換爲邏輯倉庫表。 我的問題是代理鍵。對谷歌Big Query使用Farm_fingerprint
現在,ROW_NUMBER()失敗,因爲我的數據太大。
我一直推薦使用FARM_FINGERPRINT
是否有聘請Surrogate_key代在大查詢正確的方法是什麼?
謝謝
更新1的澄清。
我的一些源表中有30個記錄數百萬個字段。要在這裏顯示大。我們正在將這些記錄轉換成需要創建代理鍵以便稍後幫助BI工具的表格。
爲此,我們的視圖(用來替換目標表)有了轉換,再加上我們使用ROW_NUMBER()函數來創建獨特的代理鍵。我們意識到該函數會強制Big Query將整個邏輯推送到一個節點上,從而導致查詢崩潰。
我們玩弄FARM_FINGERPRINT(),使用表示唯一業務鍵的串聯字段串作爲輸入來檢索INT64值以用作代理鍵。我們的信念是,這將提供一個整數,我們可以在該工具所需的BI工具中使用該整數。
我在問的是,當你有這麼大的數據集時,是否有合適的方法在Google Big Query中生成基於整數的代理鍵?
謝謝。
如果你能提供更具體的例子將是(對你更好)比較容易回答。現在它太通用了! –
澄清 - 是否打算在桌旁放一列專用的密鑰?你的桌子的模式是什麼? –