2017-03-16 22 views

回答

3

這不是一個編碼問題,但更多的與文檔類型和DTD有關。 Plain XML僅支持開箱即用的<,>,&,'"。像‘這樣的實體來自HTML實體集,並且還經常用於其他(專有)DTD。您需要在文件的序言中提供本地DTD子集,將這些實體先解析爲Unicode,或依賴MarkLogic的「修復」功能。

repair選項可能是最快的出路,但在這些實體來自哪裏以及您想要對它們做什麼的情況下,可能需要考慮更加困難。

這裏是xdmp:document-load的文件,應說明repair選項:

http://docs.marklogic.com/xdmp:document-load

HTH!

+0

感謝其工作正常 – Antony

+0

既然它的工作,你能標記這個答案爲接受?這給了grtjn的功勞,並明確表示這個問題已經解決。 –