2011-08-23 107 views
3

我正在使用ConstructingParser將XML數據解析到scala.xml.Node中。我注意到在一個XML片段上,如scala.xml.parsing.ConstructingParser拆分文本內容

<foo> bar & lt;巴茲< /富>

根ELEM不具有一個單獨的文本子方含「欄< baz」的,而是有三個獨立的文本子節點,一個包含「欄」,一種含「<」和一個含有「巴茲」。這打破了文件的後續處理。當然,我可以自己合併文本元素,但我很好奇是否有辦法讓ConstructingParser爲我做這件事。

Gr。西爾維奧

回答

0

斯卡拉是不是我的,但我敢肯定答案是「不」。絕對不能保證一個元素的文本內容會在解析爲單個文本節點後出現。在這種情況下,有文本,實體引用以及更多文本,所以結果可能不是那麼令人驚訝,以至於有三個文本節點,但無論如何也不能保證。