我是新來的豬,我正在嘗試寫一個字數統計程序。從文本中獲得的話Word中的自定義單詞分隔符在豬?
一種方法是使用TOKENIZE
功能:
WORDS = foreach INPUT generate flatten(TOKENIZE(text)) AS word;
但我只是想拆就空白,而上之類的東西逗號TOKENIZE
分裂了。我將如何做到這一點?我嘗試使用STRSPLIT(text, ' ')
,但STRSPLIT
似乎返回一個元組,而TOKENIZE
返回一個包,所以我不知道如何使用STRSPLIT
這一點。