6
在我的Scala代碼中,我使用getInputStream
方法HttpUrlConnection
類從服務器獲取響應。響應是XML數據。但是,數據包含HTML實體,如&
和'
。從服務器收到的XML響應中的特殊字符
有沒有一種方法可以用它們的文本替換這些字符,以便我可以正確解析XML?
在我的Scala代碼中,我使用getInputStream
方法HttpUrlConnection
類從服務器獲取響應。響應是XML數據。但是,數據包含HTML實體,如&
和'
。從服務器收到的XML響應中的特殊字符
有沒有一種方法可以用它們的文本替換這些字符,以便我可以正確解析XML?
有必要將這些實體編碼爲xml,以免它們干擾其語法。 <
(<)和>
(>)實體使這更明顯。解析其內容散佈於<和>符號的XML是不可能的。
Scala的scala.xml包應該爲您提供解析xml所需的工具。 Here's some guidance來自圖書館的作者。
實際上'amp'和''是XML中的預定義實體,所以你在解析包含它們的XML文件時不應該有問題。 – MarcoS 2011-05-16 13:31:49
「正確解析XML」意味着您正在使用XML解析器。 JDK自帶的代碼將正確處理這些序列,因此您使用哪一個? – Anon 2011-05-16 13:37:07