我有以下table1
與屬性co
:如何使用黑斑羚regex_extract法正則表達式或運算,並得到不同的捕獲組
|-----------------------------------------
| co
|-----------------------------------------
| fsdsdf "This one" fdsfsd ghjhgj "sfdsf"
| Just This
|-----------------------------------------
的情況下有引號 - 我想獲得的第一次出現的內容。如果沒有引號,我想按原樣返回內容。 對於上面的例子: 對於第一線 - This one
對於第二行 - Just This
我在帕拉SQL代碼,解決了第一種情況:
select regexp_extract (co, '"([^"]*")',1) from table1
我怎麼可以概括它來檢測並返回下一個案例需要的結果?
我想你可以在sql中使用'COALESCE'或'IF()'來返回空洞字符串,如果不匹配的話。 –
SQL不是執行此操作的最佳工具。你是如何在Impala內部清理這些數據的? –
數據已經在黑斑羚中。我想使用REGEX功能,而不是上述的SQL功能,因爲它更高效。我認爲解決方案可以在REGEX中使用OR表達式,如下所示:http://stackoverflow.com/questions/8020848/and-or-operator-in-regular-expression – Avi