0
我有一個XML結構像如何添加頭信息來排信息在解析XML火花
<root>
<bookinfo>
<time>1232314973</time>
<requestID>233</requestID>
<supplier>asd123</supplier>
</bookinfo>
<books>
<book>
<name>book1</name>
<pages>124</pages>
</book>
<book>
<name>book2</name>
<pages>456</pages>
</book>
<book>
<name>book4</name>
<pages>789</pages>
</book>
</books>
</root>
我知道我可以解析books
,如:
val xml = sqlContext.read.format("com.databricks.spark.xml")
.option("rowTag", "book").load("FILENAME")
但我會像將supplier
這樣的標題信息添加到每一行中。
有沒有辦法將這個「headerinfo」添加到所有具有spark的行而不加載文件兩次並將信息存儲在全局變量/ val中?
在此先感謝!
感謝,幫助,生病投了答案。 – kf2