的特定信息預期輸出爲:(Hadoop definitive guide,Tom white,24.90)
。我想從XML輸入中提取使用Hadoop豬拉丁文
我試過使用Regex_Extract()
函數。但是,沒有運氣。有人可以幫我嗎?
輸入到我的腳本是:
<CATALOG>
<BOOK>
<TITLE>Hadoop DEFINITIVE GUIDE</TITLE>
<AUTHOR>TOM WHITE</AUTHOR>
<COUNTRY>US</COUNTRY>
<COMPANY>CLOUDERA</COMPANY>
<PRICE>24.90</PRICE>
<YEAR>2012</YEAR>
</BOOK>
<BOOK>
<TITLE>Programming Pig</TITLE>
<AUTHOR>Alan Gates</AUTHOR>
<COUNTRY>USA</COUNTRY>
<COMPANY>Horton Works</COMPANY>
<PRICE>30.90</PRICE>
<YEAR>2013</YEAR>
</BOOK>
</CATALOG>
你是什麼豬的版本?我猜可以從Pig 0.9中獲得Rank。劇本,我完美地寫了作品。 –