過濾從臨時表從`regexp_split_to_table`重複記錄

我有如下表DATAS。表名是過濾從臨時表從`regexp_split_to_table`重複記錄

類

| ID    | CATEGORY      | 
+----------------+--------------------------+ 
| 1    | Apple,Orance-........... | 
| 2    | Apple,Grapes-........... | 
| 3    | Juice,Apple,Cucumber-... |

我試着通過如下解析逗號分隔值作爲各行創建臨時表

| ID   | split_categori 
+-------------+------------------- 
| 1   | Apple 
| 2   | Orange 
| 3   | Grapes 
| 4   | Juice 
| 5   | Cucumber

我使用下面的代碼來做到這一點。

SELECT CATEGORI.ID, regexp_split_to_table(CATEGORI.CATEGORY, E',') AS split_categori FROM CATEGORI;

CATEGORI是表名。 ID和CATEGORY是列名

它可以成功地能夠得到的所有逗號分隔值作爲各行，但隨後不過濾重複的元素，所以我的新的臨時表split_categori由重複的記錄行。

我怎樣才能夠過濾這些重複記錄？有沒有辦法使用查詢來做到這一點，或者我應該依賴於ResultSet嗎？

來源

2016-10-13 Learner

如果您有不同的ID相同categori，你要選擇哪一個ID？例如爲什麼你有1，蘋果而不是2，蘋果在預期的結果？ –

我只想列出CATEGORY中所有逗號分隔的值作爲單個行，沒有任何重複值。 – Learner

正如你似乎並不關心你挑選重複的類別ID，您可以使用：

select min(c.id) as id, t.name 
from categori c 
    cross join regexp_split_to_table(c.category, E',') AS t(name) 
group by t.name 
order by 1;

注意，使用一組在select列表返回函數不鼓勵，不應該被使用任何更多，這就是爲什麼我將regexp_split_to_table()移到from條款。

但是regexp_split_to_table()是一個非常慢的功能，只能在真的需要在正則表達式上拆分時使用。使用string_to_array()將多更高效：

select min(c.id) as id, t.name 
from categori c 
    cross join unnest(string_to_array(c.category, ',')) AS t(name) 
group by t.name 
order by 1

這裏是一個正在運行的例子：http://rextester.com/YSHT62551

來源

2016-10-13 06:36:43

你是一個天才兄弟 – Learner

它就像一個魅力！ :) – Learner

非常感謝你如此如此如此 – Learner

過濾從臨時表從`regexp_split_to_table`重複記錄

回答

相關問題