0
我已經存儲在AWS S3存儲桶中的XML文件。我想提取XML元數據並加載到HDFS上的HIVE表中。有沒有任何工具可以幫助推廣這項活動?如何使用Hive讀取S3 XML文件查詢
我已經存儲在AWS S3存儲桶中的XML文件。我想提取XML元數據並加載到HDFS上的HIVE表中。有沒有任何工具可以幫助推廣這項活動?如何使用Hive讀取S3 XML文件查詢
那麼,您可能需要使用HIVE XML SerDe來讀取XML文件或編寫/使用可以理解XML的自定義UDF。
一些參考文獻,可以幫助:https://community.hortonworks.com/articles/972/hive-and-xml-pasring.html https://github.com/dvasilen/Hive-XML-SerDe/wiki/XML-data-sources https://community.hortonworks.com/questions/47840/how-do-i-do-xml-string-parsing-in-hive.html
與hivexmlserde-1.0.5.3.jar的幫助下設法從XML提取數據。 –
很棒@ Pawan! –