用於NOT IN的TSQL優化代碼

我繼承了一個我希望優化的舊SQL腳本，但經過多次測試後，我必須承認，我所有的測試都只是用重複塊創建大型SQL。我想知道是否有人可以針對以下模式提出更好的代碼（請參閱下面的代碼）。我不想使用臨時表（WITH）。爲了簡單起見，我只放了3個級別（表TMP_C，TMP_D和TMP_E），但原始SQL有8個級別。用於NOT IN的TSQL優化代碼

WITH 
TMP_A AS (
SELECT 
ID, 
Field_X 
FROM A 

TMP_B AS(
SELECT DISTINCT 
ID, 
Field_Y, 
CASE 
    WHEN Field_Z IN ('TEST_1','TEST_2') THEN 'CATEG_1' 
    WHEN Field_Z IN ('TEST_3','TEST_4') THEN 'CATEG_2' 
    WHEN Field_Z IN ('TEST_5','TEST_6') THEN 'CATEG_3' 
    ELSE 'CATEG_4' 
END AS CATEG 
FROM B 
INNER JOIN TMP_A 
ON TMP_A.ID=TMP_B.ID), 

TMP_C AS (
SELECT DISTINCT 
ID, 
CATEG 
FROM TMP_B 
WHERE CATEG='CATEG_1'), 

TMP_D AS (
SELECT DISTINCT 
ID, 
CATEG 
FROM TMP_B 
WHERE CATEG='CATEG_2' AND ID NOT IN (SELECT ID FROM TMP_C)), 

TMP_E AS (
SELECT DISTINCT 
ID, 
CATEG 
FROM TMP_B 
WHERE CATEG='CATEG_3' 
AND ID NOT IN (SELECT ID FROM TMP_C) 
AND ID NOT IN (SELECT ID FROM TMP_D)) 

SELECT * FROM TMP_C 
UNION 
SELECT * FROM TMP_D 
UNION 
SELECT * FROM TMP_E

非常感謝您的幫助。

來源

2013-05-09 Bouzouki

不是'NOT IN'上'TMP_D'的'WHERE'條款的其他部分和'TMP_E'多餘的？由於類別不重疊，如'TMP_B'中定義的，在隨後的查詢中不需要檢查除類別以外的任何內容。這使得它們看起來像只在'UNION'返回時纔會過濾'CATEG_4'。（是的，'distinct'在那裏。） – HABO 2013-05-09 15:39:27

@HABO：如果ID是唯一的，它們將是多餘的，但事實並非如此。不幸的是，ID不是唯一的，我們可以使用ID = 10和Field_Z = TEST_1的記錄，也可以使用ID = 10但Field_Z = TEST_3的記錄。 – Bouzouki 2013-05-09 17:16:51

首先，選擇DISTINCT將防止結果集中出現重複，這樣您就會過度使用條件。通過添加「WITH」定義並嘗試嵌套它們的使用使其更容易跟隨。數據最終都來自「B」表，其中也有「A」中的關鍵匹配。讓我們從這個開始吧......因爲您沒有使用結果集中（B）Field_Y或（A）Field_X的任何內容，請不要將它們添加到混淆中。

SELECT DISTINCT 
     B.ID, 
     CASE WHEN B.Field_Z IN ('TEST_1','TEST_2') THEN 'CATEG_1' 
      WHEN B.Field_Z IN ('TEST_3','TEST_4') THEN 'CATEG_2' 
      WHEN B.Field_Z IN ('TEST_5','TEST_6') THEN 'CATEG_3' 
      ELSE 'CATEG_4' 
      END AS CATEG 
    FROM 
     B JOIN A ON B.ID = A.ID 
    WHERE 
     B.Field_Z IN ('TEST_1', 'TEST_2', 'TEST_3', 'TEST_4', 'TEST_5', 'TEST_6')

where子句將只包括那些你想要的類別合格值，而且還有每個每個類別的結果。

現在，如果您確實需要「Field_Y」或「Field_X」中的其他值，則會生成不同的查詢。但是，您的Tmp_C，Tmp_D和Tmp_E無論如何都只會詢問ID和CATEG列。

來源

2013-05-09 15:38:52 DRapp

可能是愚蠢的問題：'UNION'對排序有什麼影響，也就是說，TEST_3/4s之前原來是否會返回所有TEST_1/2s？如果不是原來的查詢真的很瘋狂。（並且至少應該使用'UNION ALL'而不是'UNION'。） – Rup 2013-05-09 15:44:48

@DRAPE：實際上，我們不需要Field_X或Field_Y作爲示例。我忘了將它們從（更復雜的）原始查詢中移除。現在看起來很簡單，我看你的答案。謝謝你的幫助。 – Bouzouki 2013-05-09 16:12:45

@Rup：不，他們不需要根據我的理解排序的數據（這是一箇舊的查詢，我可以假設他們試圖做什麼）。這不是唯一的瘋狂！ – Bouzouki 2013-05-09 16:16:04

這可能有更好的表現

SELECT DISTINCT B.ID, 'CATEG_1' 
    FROM 
     B JOIN A ON B.ID = A.ID 
    WHERE 
     B.Field_Z IN ('TEST_1', 'TEST_2') 
UNION 
SELECT DISTINCT B.ID, 'CATEG_2' 
    FROM 
     B JOIN A ON B.ID = A.ID 
    WHERE 
     B.Field_Z IN ('TEST_3', 'TEST_4') 
...

來源

2013-05-09 17:28:11 Paparazzi

用於NOT IN的TSQL優化代碼

回答

相關問題