我在我的項目中使用了dbpedia,並且我想創建一個本地sparql終點,因爲在線一個不可靠。我下載了數據轉儲(大型NT文件)並決定使用Jena TDB。使用NetBeans IDE正在使用的輸入流源NT文件的讀取,然後使用下面的代碼行到NT文件加載到datasetGraph:如何將大三元數據加載到jena中tdb
TDBLoader.load(indexingDataset, inputs, true);
我讓現在運行約5小時,它仍然沒有完成。雖然這樣做,但筆記本電腦上的所有內容似乎都會因爲它佔用了我所有的物理內存空間而放慢速度。有沒有更快的方法來做到這一點?
該文檔說使用tdbloader2,但它僅在Windows使用時可用於Linux。如果有人能夠告訴我如何在Windows中使用這個工具使用cygwin,那真的很有幫助。請考慮我從未在窗口中真正使用過Cygwin。
我目前使用tdbloader2將大約1.2億個三元組加載到TDB中。這很慢(8小時以上),並且隨着負載的進展而減慢。他們的任何基準比較tdbloader2,tdbloader3和tdbloader4嗎?或者有什麼辦法可以合併多個TDB數據庫?任何意見,將不勝感激。 – 2014-01-31 09:32:05