2017-06-29 54 views
0

我試圖從使用VTD-XML的JMDict項目中解析JMDict_e.xml文件。但是,我遇到了解析錯誤。ParserException對於使用VTD-XML的&符號的XML文件

出現

唯一的錯誤信息是:

ParserException: com.ximpleware.EntityException: Errors in Entity: Illegal entity char 

從XML的簡短摘錄的樣子:

<entry> 
    <ent_seq>1279770</ent_seq> 
    <k_ele> 
     <keb>構成要素</keb> 
    </k_ele> 
    <r_ele> 
     <reb>こうせいようそ</reb> 
    </r_ele> 
    <sense> 
     <pos>&n;</pos> 
     <pos>&adj-no;</pos> 
     <field>&comp;</field> 
     <gloss>components</gloss> 
     <gloss>elements</gloss> 
     <gloss>parts</gloss> 
    </sense> 
</entry> 

我相信,在pos領域,非法字符很可能是&號。有沒有辦法讓vtd-xml不將這些&符號視爲特殊字符?還是有不同的方法來解決這個問題?

+2

XML不允許&符號;也許如果你換成「&」,這將有所幫助。我不熟悉vtd-xml。 – arcy

回答

1

VTD-XML只識別那些內置的字符實體。在我看來,大多數實體是無效的。在將其提供給解析器之前,您可能需要解決這些問題。

+1

謝謝!我瀏覽了文件並刪除了&符號,然後vtd-xml能夠解析它。 – wayway

相關問題