2012-10-10 34 views
5

我試圖找到對,享有同一套電視用戶的顯示了這個簡化的例子如何查找通過多個元組(行)共享一個屬性(列)的對?

比方說,我有每個用戶得到的,他們彼此欣賞電視節目的條目表:

|USER | Show  | 
|-----|-------------| 
|001 | Lost  | 
|001 | South Park | 
|002 | Lost  | 
|003 | Lost  | 
|003 | South Park | 
|004 | South Park | 
|005 | Lost  | 
|006 | Lost  | 

然後我想的結果:

|USER1 |USER2 | 
|------|------| 
|001 |003 | 
|003 |001 | 
|002 |005 | 
|002 |006 | 
|005 |002 | 
|005 |006 | 
|006 |002 | 
|006 |005 | 

或更好的版本是:

|USER1 |USER2 | 
|------|------| 
|001 |003 | 
|002 |005 | 
|002 |006 | 
|005 |006 | 

基本上說:用戶1喜歡與用戶3相同的一組節目。

我一直在玩GROUP BY和JOIN,但我仍然找不到答案:(。

到目前爲止,我發現,使用

SELECT s1.User as USER1, s2.User as USER2, s1.Show as Show 
FROM Shows s1 JOIN (SELECT * FROM Shows) s2 
ON s1.Shows=s2.Shows AND s1.User!=s2.User; 

其中產量的用戶對他們共有的顯示。但我不知道該從哪裏出發。

+1

向我們展示你已經玩什麼左右。 – Kermit

+0

我認爲預期結果與提供的樣本數據不符。在示例數據中,您有6個用戶,但只有兩個電視節目,預期的結果反之亦然。 –

+0

SELECT s1.User爲USER1,s2.User爲USER2,s1.Show作爲顯示 從節目中S1 JOIN(SELECT * \t從節目中)S2 ON s1.Shows = s2.Shows AND s1.User!= S2 。用戶; 這產生了至少一個相同電視節目的對的列表。 @DanielHilgarth我想查找觀看所有相同電視節目的用戶對。用戶1和用戶3都觀看Lost和South Park。用戶2和用戶5都觀看Lost。用戶2和用戶6都觀看Lost。 etc. –

回答

4

如果你能接受的,而不是製表結果CSV,你可以簡單地組表兩次:

SELECT GROUP_CONCAT(User) FROM (
    SELECT User, GROUP_CONCAT(DISTINCT `Show` ORDER BY `Show` SEPARATOR 0x1e) AS s 
    FROM  Shows 
    GROUP BY User 
) t GROUP BY s 

否則,您可以加入上面的子查詢本身:

SELECT DISTINCT LEAST(t.User, u.User) AS User1, 
      GREATEST(t.User, u.User) AS User2 
FROM (
    SELECT User, GROUP_CONCAT(DISTINCT `Show` ORDER BY `Show` SEPARATOR 0x1e) AS s 
    FROM  Shows 
    GROUP BY User 
) t JOIN (
    SELECT User, GROUP_CONCAT(DISTINCT `Show` ORDER BY `Show` SEPARATOR 0x1e) AS s 
    FROM  Shows 
    GROUP BY User 
) u USING (s) 
WHERE t.User <> u.User 

看到他們在sqlfiddle

當然,如果重複(User, Show)對被保證不要在Shows表中,你可以通過從GROUP_CONCAT()聚合的DISTINCT關鍵字提高性能。

+0

剛剛嘗試過這個,它工作得很好!謝謝!我甚至不知道像GROUP_CONCAT這樣的事情。 –

+0

@HeartAce,我爲你的娛樂添加了另一個答案。 – Jodrell

0

在思考這個我就越想知道,如果我分組的組,

select 
    group_concat( 
     User 
     order by User 
     separator ', ' 
    ) LikeViewers 
    , Shows 
from 
(
select 
     User 
    , group_concat(
     concat('"', Show, '"') 
     order by Show 
     separator ', ' 
     ) Shows 
    from 
    Viewings 
    group by 
    User 
) ViewerGroups 
group by 
    Shows 

產生這樣

|LikeViewers |Shows    | 
|-------------|--------------------| 
|002, 005, 006|"Lost"    | 
|001, 003  |"Lost", "South Park"| 
|004   |"South Park"  | 

一個輸出誠然,結果可能是更可重複使用的,但我認爲後這是一個有趣的想法。

Fiddle Here

相關問題