0
我正在使用來自kafka主題的XML文件。任何人都可以告訴我如何將XML解析爲數據框。如何解析流XML到數據框?
val df = sqlContext.read
.format("com.databricks.spark.xml")
//.option("rowTag","ns:header")
// .options(Map("rowTag"->"ntfyTrns:payloadHeader","rowTag"->"ns:header"))
.option("rowTag","ntfyTrnsDt:notifyTransactionDetailsReq")
.load("/home/ubuntu/SourceXML.xml")
df.show
df.printSchema()
df.select(col("ns:header.ns:captureSystem")).show()
我能夠精確的XML。我的信息不知道如何傳遞或轉換或卡夫卡的主題加載RDD [字符串]以SQL READ API。
謝謝!