我想分析以下類型的文本。例1 <root>my name is <j> <b> mike</b> </j> </root>
用於非xml的DOM解析器
例如使用DOM解析器是2
<root> my name is <mytag1 attribute="val" >mike</mytag1> and yours is <mytag2> john</mytag2> </root>
我可以解析?我不會有相同的格式埃夫裏的時間。我可以有不同的格式,其中標籤nested.I不知道格式提前。
我想分析以下類型的文本。例1 <root>my name is <j> <b> mike</b> </j> </root>
用於非xml的DOM解析器
例如使用DOM解析器是2
<root> my name is <mytag1 attribute="val" >mike</mytag1> and yours is <mytag2> john</mytag2> </root>
我可以解析?我不會有相同的格式埃夫裏的時間。我可以有不同的格式,其中標籤nested.I不知道格式提前。
您可以使用DOM解析器來處理您提供的示例 - 它們是有效的XML。但是,根據您的主題行,您將無法將其用於非XML。
當你說你可以有「嵌套標籤的不同格式」,你究竟是什麼意思?如果它總是嵌套,例如簡單
<root>
<tag1>
<tag2>
<tag3>
Stuff
</tag3>
</tag2>
</tag1>
</root>
那就沒事了。做T這樣,所以沒有理由可以
<root>
<tag1>
<tag2>
Stuff
</tag1> <!-- Invalid -->
</tag2>
</root>
兩個例子都是有效的XML文檔:然而,XML解析器會不喜歡的標記,其中的「外部」標籤前的「內部」一個封閉。
如果您的XML非常簡單,特別是如果它將文本和標籤組合在一起,您可能首先需要通過XSL transformation來運行它,以便更容易地解析或轉換爲其他格式,如HTML。