2016-02-27 98 views
1

的子非零字符我有像在蜂房外部表蜂巢:計數在一個字符串

<id>^<count>^<distinct_count>|<id>^<count>^<distinct_count>|... 

的列下面的字符串有兩種定界符。 |在一個實體級別和^上子實體水平

我具有由非零distinct_countscounts,這意味着給定的一個字符串我有計數的總和所定義的度量檢查是否重複計數(或計數 - 我可以檢查)是非零,如果它標記爲flag爲1.那麼度量將是sum(flags)。我必須在下一步中將此度量標準存儲在彙總表中。

請建議一種方法讓我在蜂巢中做到這一點

回答

0

我認爲這是不可能的。結束使用相同的外部Python映射器。

0

如果你想在一個字符串s計數的非零count數,它似乎要解決

length(
    regexp_replace(
     regexp_replace(s, "[^^|]*\\^0\\^[^^|]*\\|?", ""), 
     "[^^|]*\\^[^^|]*\\^[^^|]*\\|?", 
     "1" 
    ) 
) 

首先regexp_replace去除部分零count,第二regexp_replace替換單一的符號其餘部分(它不一定是"1",任何符號都可以),因此length返回非零零件數count