我有很多需要解析的長文檔。文檔格式與XML相似,但實際上不是xml。C#如何解析非標準的xml
下面是一個例子:
<DOC>
<TEXT>it's the content P&G</TEXT>
</DOC>
<DOC>
<TEXT>it's antoher</TEXT>
</DOC>
注意,有多發性根標籤 - <DOC>
,與實體&
應爲XML &
。
因此,上述文件不是標準的xml。
我可以使用XmlDocument
解析文件,還是應該編寫自己的解析器?
會用&替換&,並用包裝整個字符串... 就夠了嗎?還是有更多? –
由於它不是XML,因此您將無法使用XML解析器。你會想要決定它到底是什麼,然後使用解析器來解決這個問題。 –
我將會殘酷地移除「XML」標籤,因爲這是一個關於如何解析某種非XML的語言的問題。 –