將結果限制爲n個唯一的列值？

我有一些MySQL的結果是這樣的：將結果限制爲n個唯一的列值？

--------------------------- 
| name | something_random | 
--------------------------- 
| john | ekjalsdjalfjkldd | 
| alex | akjsldfjaekallee | 
| alex | jkjlkjslakjfjflj | 
| alex | kajslejajejjaddd | 
| bob | ekakdie33kkd93ld | 
| bob | 33kd993kakakl3ll | 
| paul | 3k309dki595k3lkd | 
| paul | 3k399kkfkg93lk3l | 
etc...

這正好爲結果的行1000的。我需要將結果數量限制爲前50個唯一名稱。我認爲這是一個簡單的解決方案，但我不確定。

我試過使用派生表和變量，但不能完全到達那裏。如果我能想出每次名稱不同時如何增加一次變量，我想我可以說WHERE variable <= 50。

修訂

我已經試過了內部連接方法（ES）以下建議。問題是這樣的：

子選擇SELECT DISTINCT name FROM testTable LIMIT 50抓住前50個不同的名稱。也許我在原始文章中不夠清楚，但這太限制了我的查詢。在我的查詢中，並不是表中的每個名字都返回結果中。讓我修改我的原始示例：

---------------------------------- 
| id | name | something_random | 
---------------------------------- 
| 1 | john | ekjalsdjalfjkldd | 
| 4 | alex | akjsldfjaekallee | 
| 4 | alex | jkjlkjslakjfjflj | 
| 4 | alex | kajslejajejjaddd | 
| 6 | bob | ekakdie33kkd93ld | 
| 6 | bob | 33kd993kakakl3ll | 
| 12 | paul | 3k309dki595k3lkd | 
| 12 | paul | 3k399kkfkg93lk3l | 
etc...

所以我在這裏添加了一些id號。這些ID號碼與表格中的人員姓名相關。因此，您可以在結果中看到，表中不是每個人都必須在結果中（由於某個WHERE條件）。因此，在列表中的第50個獨立的名稱將始終有一個ID號高於49. 50人可能是編號79，234，4954等..

所以回到問題。子選擇SELECT DISTINCT name FROM testTable LIMIT 50選擇表格中的前50個名稱。這意味着我的搜索結果將僅限於ID爲< = 50的名稱太緊密。如果某些名稱在查詢中沒有顯示（由於某個WHERE條件），那麼它們仍被視爲50個不同名稱之一。所以你最終得到的結果太少了。

更新2

要@trapper：這是什麼我的查詢看起來像一個基本的簡化：

SELECT 
    t1.id, 
    t1.name, 
    t2.details 
FROM t1 
LEFT JOIN t2 ON t1.id = t2.some_id 
INNER JOIN 
    (SELECT DISTINCT name FROM t1 ORDER BY id LIMIT 0,50) s ON s.name = t1.name 
WHERE 
    SOME CONDITIONS 
ORDER BY 
    t1.id, 
    t1.name

而且我的結果是這樣的：

---------------------------------- 
| id | name |   details | 
---------------------------------- 
| 1 | john | ekjalsdjalfjkldd | 
| 3 | alex | akjsldfjaekallee | 
| 3 | alex | jkjlkjslakjfjflj | 
| 4 | alex | kajslejajejjaddd | 
| 6 | bob | ekakdie33kkd93ld | 
| 6 | bob | 33kd993kakakl3ll | 
| 12 | paul | 3k309dki595k3lkd | 
| 12 | paul | 3k399kkfkg93lk3l | 
... 
| 37 | bill | kajslejajejjaddd | 
| 37 | bill | ekakdie33kkd93ld | 
| 41 | matt | 33kd993kakakl3ll | 
| 50 | jake | 3k309dki595k3lkd | 
| 50 | jake | 3k399kkfkg93lk3l | 
----------------------------------

的結果在id = 50處停止。列表中不包含50個不同的名稱。只有大約23個不同的名字。

來源

2012-03-01 Jake Wilson

LIMIT 0,50無關與ID行。它盲目地從整個結果集中取0到50行並返回它們。因此，只要在他之前不超過49個獨特的名字，你就會很高興地獲得名字'jim'，id '79,234,4954'。 – trapper 2012-03-02 18:03:06

@trapper看看我上面的第二個更新。 – 2012-03-02 18:29:25

你的'WHERE'條件可能在錯誤的地方，它應該放在括號內的'SELECT'中，除非你想在*已經把它縮減到50個名字後將它應用到結果*。 – trapper 2012-03-02 21:43:31

My MySql語法可能很生疏，但是想法是使用查詢來選擇前50個不同的名稱，然後對名稱進行自聯接，並從聯接中選擇名稱和其他信息。

select a.name, b.something_random 
from Table b 
    inner join (select distinct name from Table order by RAND() limit 0,50) a 
     on a.name = b.name

來源

2012-03-01 23:38:26 tvanfosson

我會嘗試這種方法。這實質上是執行2個查詢？或2 * num_of_unique_names查詢？另外，你爲什麼內心加入一個表與自己？ – 2012-03-01 23:40:21

希望您有一個名稱索引，它將導致索引掃描加上同一個表上的索引連接。我想你可以調用這2個查詢，但使用遊標的時間很短，我不知道你會怎麼做。根據您的數據，使用光標可能會更糟糕，即全表掃描。當然，您需要名稱索引來避免加入。 – tvanfosson 2012-03-01 23:43:15

@Jakobud--與此相關的一個潛在問題是，您可能會得到排名前50的字母名稱。如果是這樣，你可能想要拋出一個'Order By RAND（）' - 再一次，我的語法可能需要一些修正。 – tvanfosson 2012-03-01 23:50:07

SELECT DISTINCT name FROM table LIMIT 0,50

編輯：啊，是我誤解了問題的第一次，本應該做的伎倆雖然:)

SELECT a.name, b.something_random 
FROM `table` b 
INNER JOIN (SELECT DISTINCT name FROM `table` ORDER BY RAND() LIMIT 0,50) a 
    ON a.name = b.name ORDER BY a.name

這項工作是怎樣的(SELECT DISTINCT name FROM表ORDER BY RAND() LIMIT 0,50)的部分是什麼翻出名稱，包括在加入。所以我在這裏隨機抽取了50個獨特的名字，但是如果你願意的話，你可以把它改成任何其他的選擇標準。

然後你將這些結果加回到你的表中。這將這50個選定名稱中的每一個都鏈接到所有具有匹配名稱的行，以獲得最終結果。最後ORDER BY a.name只是爲了確保每個名字的所有行最終分組在一起。

來源

2012-03-01 23:34:22 trapper

所有似乎只是將結果限制爲50行。我想你誤解了我的問題。返回的行數是任意的。我只需要將結果限制在前50個不同的名稱。返回的行數可能是任何數字> 50. – 2012-03-01 23:38:57

已更新的答案 – trapper 2012-03-02 17:59:00

這應做到：

SELECT tA.* 
FROM 
    testTable tA 
INNER JOIN 
    (SELECT distinct name FROM testTable LIMIT 50) tB ON tA.name = tB.name 
;

來源

2012-03-01 23:50:29 StudyOfCrying

正如在tvanfosson的類似答案中指出的那樣，子查詢中的select可能需要以某種方式（或通過RAND（））進行排序以獲得您想要的結果。 – StudyOfCrying 2012-03-01 23:51:42

這讓我更接近，看看我上面的更新。 – 2012-03-02 16:15:00

將結果限制爲n個唯一的列值？

回答

相關問題