我需要知道如何解析Spark中的XML文件。我正在接收來自kafka的流式數據,然後需要解析流式數據。解析Apache Spark中的XML數據
這裏是我的星火代碼接收數據:
directKafkaStream.foreachRDD(rdd ->{
rdd.foreach(s ->{
System.out.println("&&&&&&&&&&&&&&&&&" +s._2);
});
和結果:
<root>
<student>
<name>john</name>
<marks>90</marks>
</student>
</root>
如何通過這些XML元素?
您是否搜索過此前的問題?如:http://stackoverflow.com/questions/33078221/xml-processing-in-spark –
@Binary Nerd,謝謝你的迴應。我的火花應用程序正在逐行讀取數據。所以我需要逐行解析,而不使用開始元素和/或結束元素。 – user6325753