在豬腳本中,我想找到一種方法來轉義我的數據中的分隔符,這樣它就不會被解釋爲額外的列。例如,如果我使用冒號作爲分隔符,並且我有一個值爲「foo:bar」的列,我希望該字符串解釋爲單個列,而不需要加載器在中間拾取逗號。如何擺脫價值中發現的分隔符 - 豬腳本?
1
A
回答
0
您可以嘗試http://pig.apache.org/docs/r0.12.0/func.html#regex-extract-all
正則表達式可能需要進行調整。
0
看起來,Pig把Input作爲字符串,它不那麼聰明以便確定數據是什麼或不是什麼。
豬存儲在強Tokenizer上工作。所以,如果ü要像做
a = LOAD '/abc/def/file.txt' USING PigStorage(':');
它不會似乎是解決你的問題。但是如果我們可以編寫我們自己的PigStorage()方法,我們可能會遇到一些解決方案。
我會嘗試發佈代碼來解決這個問題。
0
你可以使用STRSPLIT(string,regex,limit);用於基於分隔符的列拆分。
相關問題
- 1. 如何擺脫jscroll分隔符?
- 2. 擺脫了分隔符
- 3. Response.Write - 我現在如何擺脫腳本?
- 4. 如何擺脫谷歌偏好腳本?
- 5. 在豬腳本
- 6. 如何擺脫java中逗號分隔字符串中的重複項?
- 7. 桑達發現自己和擺脫腳本結果
- 8. NSTableView擺脫空白分隔列
- 9. 如何在matlab分析股票價格中擺脫Nans?
- 10. 豬腳本STRSPLIT
- 11. 如何擺脫HTML中的換行符
- 12. 如何擺脫列中的冗餘值?
- 13. 如何豬腳本
- 14. 如何擺脫sas中的字符
- 15. 如何擺脫vim中的^ I符號?
- 16. 如何擺脫字典中的None值?
- 17. 擺脫樣本數據中的峯值
- 18. 如何擺脫swagger的「價值」json {「value」:「{\」swagger \「:\」2.0 \「,\」info \「{\」description?
- 19. 如何在另一個豬腳本中調用豬腳本
- 20. 如何擺脫PHP腳本輸出中的'Content-type:text/html'?
- 21. 豬腳本從
- 22. 擺脫python + selenium腳本的冗長
- 23. htaccess如何擺脫可選的最後目錄列表分隔符?
- 24. 如何擺脫ReportViewer控件呈現的RDLC中的雙頁分頁符?
- 25. UITableView - 擺脫分隔符(不只是使它們清晰)
- 26. 匹配逃脫分隔符
- 27. 如何按分隔符分隔值?
- 28. VisualStudio中 - 如何擺脫這種字符
- 29. 如何擺脫Python中列值的$符號
- 30. 如何擺脫Java中的數組字符串的空值?
感謝Fred,但我的輸入是關鍵和值的文本文件。 –
你能張貼幾行你的輸入作爲例子嗎? – Frederic
聯繫人姓名:dusre:rage是文本,我需要dusre:rage作爲關鍵聯繫人姓名的值,但截至目前它只給出dusre作爲值。 –