2017-08-30 54 views
0

我生成甲魚的三倍,全部數據集已經有大約2GB。我爲大多數測試工作了幾K的小樣本。然後我嘗試對整個數據集進行定期測試。它永遠不會加載,但它告訴我是否有錯誤。可以在讀取一個龜文件時保護(本體工具)報錯行號?

我的快速測試是將TTL文件加載到門生。我使用的是Protege 5.2(windows版本)。小樣本中沒有錯誤。但是,當我更大的樣本,它(保護)讀取我生成的ttl文件,並告訴我有一個錯誤。

• Level: INFO Time: 1504111914814 Message: ------------------------------- Loading Ontology ------------------------------- 
• Level: INFO Time: 1504111914815 Message: Loading ontology from file:/C:/Projects/gdelt/sample.ttl 
• Level: INFO Time: 1504112075814 Message: Finished loading file:/C:/Projects/gdelt/sample.ttl 
• **Level: ERROR Time: 1504112075818 Message: An error occurred whilst loading the ontology at GC overhead limit exceeded. Cause: {}** 
• Level: INFO Time: 1504112075819 Message: Loading for ontology and imports closure successfully completed in 160995 ms 

它可能需要很長的時間來加載這些樣本文件 - 然後它只是告訴我那裏是沒有的問題是,其中的任何指示的錯誤。所以,我的當前調試的方法是二進制搜索 - 生成文件的一半大,看是否有錯誤,採取折中的辦法,檢查錯誤,而且這種方式,我歸納出幾行中,我可以很容易地檢測錯誤。這真的是單調乏味。有沒有辦法讓專職人員報告它所在的位置?

如果沒有,也許有另一種工具可以用來檢查我生成的三元組的語法嗎?

+0

出的內存意味着有可能在輸入沒有錯誤,它只是本體是你的內存設置過大 – Ignazio

回答

1

的內存不足的錯誤未在解析器提高,所以沒有行號來提供。只有通過連續的嘗試才能猜出可以用內存限制加載的行數。

最好的解決方法是增加-Xmx參數值。

相關問題