2013-11-28 71 views
0

我得到了含有多個參數的鏈接XHTML文件:撒克遜轉換XML與URL參數

index.jsp?foo=bar&foo2=bar2&foo3=bar3. 

撒克遜9.5試圖解釋& foo2的作爲一個實體,顯然失敗。 我不能改變我的XML(這是一個來自互聯網的網頁),我可以用一些正則表達式來預處理它,但如果可能的話,要避免編程。

java -jar %SAXON_HOME%\saxon9he.jar -xsl:transfo.xsl -s:pageWeb.xml -o:result.html -dtd:off --recognize-uri-query-parameters:false 

不起作用。 是否可以不修改xml?

謝謝

回答

1

那麼,如果你喂的東西是不正確的XML,然後XML解析器解析器會拒絕它,這就是爲什麼有一個規範。而撒克遜只是依靠XML解析器來處理其輸入文檔和樣式表。

如果您有沒有很好地形成,然後輸入你可以嘗試使用不同的解析器像TagSoupHTML5 parser,你需要告訴撒克遜使用-x選項,例如使用java -jar %SAXON_HOME%\saxon9he.jar -x:org.ccil.cowan.tagsoup.Parser ...java -jar %SAXON_HOME%\saxon9he.jar -x:nu.validator.htmlparser.sax.HtmlParser ...

+0

啊,誤解了文檔。感謝解析器解決方案。 –