2017-03-08 128 views
0

請幫助優化我的視圖以便連接兩個表,並使用整個單詞列表的部分匹配。如何使用整個單詞連接兩個表並進行部分匹配

在附件截圖中,不應列出ProductID 12和36,因爲ProductName中的整個單詞不是=「Mix」,而是SillMix和MixPastora。

SELECT dbo.Products.ProductID, dbo.Products.ProductName, dbo.NAMES.FullName 
FROM Products 
INNER JOIN dbo.NAMES ON dbo.Products.ProductName LIKE '%' + dbo.NAMES.FullName + '%' 

enter image description here

+0

這種類型的查詢通常是有問題的。它非常需要使用字符串分隔符,以便可以隔離每個單詞,然後加入字符串的一部分。這幾乎總是一個跡象,表明架構中的某些東西需要改變。 –

+0

這裏的男人真的很喜歡那個-1按鈕。我認爲這個問題不值得贊成。它有一些改進的餘地,但這種類型的事情很具挑戰性而且相當普遍。 –

回答

0

所以你需要全名的值作爲一個整體來比較呢? 嘗試改變ON條件是這樣的:

dbo.Products.ProductName LIKE '%' + dbo.NAMES.FullName + '%' 

dbo.Products.ProductName LIKE '% ' + dbo.NAMES.FullName + ' %' OR 
dbo.Products.ProductName LIKE '% ' + dbo.NAMES.FullName OR  
dbo.Products.ProductName LIKE dbo.NAMES.FullName + ' %' 
+1

如果要查找的值位於字符串的開頭或結尾,則這不起作用。 –

+0

你是對的,那是行不通的。 – Cobra

+0

更新後的答案呢? – jambonick

0

這裏是你可以做到這一點的方法之一。我正在使用一個字符串拆分器,如果您有大量數據,可能會對性能產生嚴重的負面影響。這個分離器雖然非常麻煩。

這是分離器。

create FUNCTION [dbo].[DelimitedSplit8K] 
--===== Define I/O parameters 
     (@pString VARCHAR(8000), @pDelimiter CHAR(1)) 
RETURNS TABLE WITH SCHEMABINDING AS 
RETURN 
--===== "Inline" CTE Driven "Tally Table" produces values from 0 up to 10,000... 
    -- enough to cover VARCHAR(8000) 
    WITH E1(N) AS (
       SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL 
       SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL 
       SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 
       ),       --10E+1 or 10 rows 
     E2(N) AS (SELECT 1 FROM E1 a, E1 b), --10E+2 or 100 rows 
     E4(N) AS (SELECT 1 FROM E2 a, E2 b), --10E+4 or 10,000 rows max 
cteTally(N) AS (--==== This provides the "zero base" and limits the number of rows right up front 
        -- for both a performance gain and prevention of accidental "overruns" 
       SELECT 0 UNION ALL 
       SELECT TOP (DATALENGTH(ISNULL(@pString,1))) ROW_NUMBER() OVER (ORDER BY (SELECT NULL)) FROM E4 
       ), 
cteStart(N1) AS (--==== This returns N+1 (starting position of each "element" just once for each delimiter) 
       SELECT t.N+1 
        FROM cteTally t 
        WHERE (SUBSTRING(@pString,t.N,1) = @pDelimiter OR t.N = 0) 
       ) 
--===== Do the actual split. The ISNULL/NULLIF combo handles the length for the final element when no delimiter is found. 
SELECT ItemNumber = ROW_NUMBER() OVER(ORDER BY s.N1), 
     Item  = SUBSTRING(@pString,s.N1,ISNULL(NULLIF(CHARINDEX(@pDelimiter,@pString,s.N1),0)-s.N1,8000)) 
    FROM cteStart s 
; 

這個分離器是由傑夫·莫恩創建和完善的社區在sql server中心。你可以在這裏閱讀完整的文章。 http://www.sqlservercentral.com/articles/Tally+Table/72993/

拆分器還有其他幾個選項。關於替代品的最好的文章之一可以在這裏找到。 https://sqlperformance.com/2012/07/t-sql-queries/split-strings

既然我們已經介紹了分離器,我們可以設置一些數據並查看它是如何工作的。

declare @Products table(ProductID int, ProductName varchar(100)) 
declare @Names table(FullName varchar(100)) 

insert @Products (ProductID, ProductName) values 
(52, 'Filo Mix') 
, (36, 'Inagd SillMix') 
, (2, 'Mix Chang') 
, (12, 'Queso Manchego La MixPastora') 

insert @Names 
select 'Mix' 

SELECT p.ProductID 
    , p.ProductName 
    , n.FullName 
FROM @Products p 
INNER JOIN @Names n ON p.ProductName LIKE '%' + n.FullName + '%' 
cross apply dbo.DelimitedSplit8K(p.ProductName, ' ') x 
where x.Item = n.FullName 
相關問題