我想根據列(在查詢內創建的)「alpha_ssc_key」從列表中重複出現表中的重複項。然而,當我運行這個查詢時,它只是返回所有結果(而不是消除「alpha_ssc_key」重複的行)。任何幫助將不勝感激!使用DISTINCT在BigQuery中刪除標準SQL中的重複項
這是在BigQuery中完成的。
WITH ssc_test_view AS (
SELECT
DISTINCT CONCAT(CAST(date AS STRING), ciq_id, CAST(quantity AS STRING), CAST(cost_basis AS STRING),fund,security,class,inv_type,share_type) AS alpha_ssc_key,
_metadata_created_at AS file_date,
realized_gain_loss,
cusip,
acq_txn_no,
acquisition_date,
security,
company,
ticker,
ciq_id,
class,
inv_type,
dis_txn_no,
quantity,
categorization,
transaction_type,
cost_basis,
share_type,
fund,
net_proceeds,
unit_cost
FROM
`fcm-dw.acquisition_ssc.ssc_log`)
SELECT
*
FROM
ssc_test_view
在這種情況下min函數的功能是什麼?剛開始呢? –
它爲各自的領域取最小值。正如我所提到的那樣 - 你可以使用任何重複邏輯 - 但你只需要爲分組列表外的那些字段「選擇」一個值 –
所以我現在可以省略像MIN()這樣的聚合邏輯,因爲我沒有試圖根據這些記錄去除雜草,對嗎?想象一下我上面提到的關鍵是我想用來重複數據集的領域。我應該使用該密鑰來重複數據刪除? –