2011-11-14 45 views
3

我有一些RDF文件需要導入到tripplestore(AllegroGraph)中,但是在第一個文件中,我得到一個SAX解析器錯誤,指出存在無法識別的字符。刪除問題後,一切都很好。 然後,我嘗試在RDF上使用W3C RDF驗證器和Jena錯誤行,但我得到的是關於未定義語言的警告(絕對沒有關於錯誤行)。 你能否建議一種方法(如果可能的話)在RDF文件中查找錯誤?RDF讀取/解析錯誤

編輯:有問題的行是:

<gn:alternateName xml:lang="got">&#66352;&#66374;&#66354;&#66352;&#66365;&#66361;&#66371;&#66372;&#66352;&#66365;</gn:alternateName> 
+0

你能更具體地瞭解產出嗎?什麼是確切的錯誤信息,還有:產生錯誤的行是什麼樣的? –

回答

1

你可以用芝麻的Rio parser做驗證。 this blogpost中有關於如何與Rio合作的說明。爲了特別驗證,訣竅是創建並附加從解析器接收詳細警告和錯誤的。

但是,既然您提到您遇到的問題處於SAX/XML級別,您也可以使用通用XML驗證程序來查看錯誤。最可能的原因(但是很難說沒有更多的細節)是你在那裏有一個錯誤編碼的字符。