2009-08-30 101 views
-1

我想分析以下類型的文本。例1 <root>my name is <j> <b> mike</b> </j> </root>用於非xml的DOM解析器

例如使用DOM解析器是2

<root> my name is <mytag1 attribute="val" >mike</mytag1> and yours is <mytag2> john</mytag2> </root> 

我可以解析?我不會有相同的格式埃夫裏的時間。我可以有不同的格式,其中標籤nested.I不知道格式提前。

回答

0

您可以使用DOM解析器來處理您提供的示例 - 它們是有效的XML。但是,根據您的主題行,您將無法將其用於非XML

當你說你可以有「嵌套標籤的不同格式」,你究竟是什麼意思?如果它總是嵌套,例如簡單

<root> 
    <tag1> 
    <tag2> 
     <tag3> 
     Stuff 
     </tag3> 
    </tag2> 
    </tag1> 
</root> 

那就沒事了。做T這樣,所以沒有理由可以

<root> 
    <tag1> 
    <tag2> 
     Stuff 
    </tag1> <!-- Invalid --> 
    </tag2> 
</root> 
1

兩個例子都是有效的XML文檔:然而,XML解析器會不喜歡的標記,其中的「外部」標籤前的「內部」一個封閉。

如果您的XML非常簡單,特別是如果它將文本和標籤組合在一起,您可能首先需要通過XSL transformation來運行它,以便更容易地解析或轉換爲其他格式,如HTML。