2014-07-21 53 views
0

我已經使用我的元數據規範公開可用的邊界列表圖形數據創建了一堆ttl文件。我無法將一些這些ttl文件上傳到Fuseki上。這是他們的樣子(結構):爲什麼我無法將這個ttl文件加載到Jena-Fuseki上?

[] <authorID> <1399> ; 
<authorName> "Dimitris Samaras";. 
<1399> <authorIDof> "Dimitris Samaras" . //line 363 
<1399> <nodetype> <AUTHOR> . 

[] <authorID> <1407> ; 
<authorName> "Haojun Wang";. 
<1407> <authorIDof> "Haojun Wang" . 
<1407> <nodetype> <AUTHOR> . 

[] <authorID> <1450> ; 
<authorName> "Zhigang Zhu";. 
<1450> <authorIDof> "Zhigang Zhu" . 
<1450> <nodetype> <AUTHOR> . 

等等....

定式讓我當我嘗試上傳文件以下錯誤:

14:32:33 INFO [80] POST http://localhost:3030/ds/upload 
14:32:33 INFO [80] Upload: Filename: dblp1111.ttl, Content-Type=application/oct 
et-stream, Charset=null => Turtle 
14:32:33 ERROR [line: 363, col: 11] Bad character encoding 
14:32:33 INFO [80] 400 Parse error: [line: 363, col: 11] Bad character encoding 
(25 ms) 

在哪裏我錯了嗎?

+0

** ERROR [line:363,col:11]錯誤的字符編碼**文件的字符編碼是什麼? –

+0

編碼在ANSI – user3451166

+1

這可能意味着很多不同的事情。有關更多詳細信息,請參見例如[什麼是ANSI格式?](http://stackoverflow.com/q/701882/1281433)。 'file -i '或'enca '返回什麼? –

回答

3

(更正的答案)

這是行號錯誤的一種情況。它僅僅表明解析器在錯誤發生時的位置(UTF-8中的錯誤編碼),但解析器先行讀取並使用Java的bult-in字節轉換爲大塊(128K)的UTF8轉換以提高效率。

Java不會報告字節流中的錯誤編碼位置,只會發生錯誤。所以你必須「分而治之」

你可以試試Jena「arq.utf8」中的程序,該程序讀取UTF-8並自動進行轉換,以報告地點壞編碼位於(在幾個字符位置內)。

[錯誤答案]

龜背是UTF-8 - 沒有選擇。我懷疑「Dimitris Samaras」實際上有重音字符,它們在ISO-8859和UTF-8中有不同的編碼。

相關問題