2012-11-12 59 views
2

目前,我們使用Virtuoso來存儲RDF三元組。我們想要一種自動化的方式將RDF文件加載到數據庫中。數據可能非常大,所以目前我們依靠Virtuoso bulk data loader來加載數據;但是,未來我們可能會轉而使用其他三重商店,因此我不想依賴這樣的平臺特定的解決方案。是否有更大的,跨平臺的方式將大型RDF文件加載到三重商店?將大型RDF加載到三重商店的跨平臺方法

我們的大部分編程都是在Python中完成的,因此使用Python綁定的解決方案將更可取。

我很新的語義網絡技術,所以請讓我知道如果我的問題不夠詳細,我會盡量提供更多信息。謝謝!

回答

1

有任何數量的Virtuoso RDF的插入在http://virtuoso.openlinksw.com/dataspace/dav/wiki/Main/VirtRDFInsert詳述的方法,其中大部分是特定於炫技部分原因是由於功能是唯一的演奏家一樣的WebDAV & ODS或其他商店不同的方式實現的功能或根本沒有。

您的情況中最常用的方法可能是將數據集讀入Python並使用SPARQL 1.1更新(http://www.w3.org/TR/sparql11-update/)命令將數據插入/加載到Virtuoso或任何其他支持SPARQL 1.1更新的三重存儲中,我想象現在大多數人會做。這種方法的主要缺點是插入過程必須在Python中進行管理,以確保數據一致地加載,處理死鎖,回滾等,這會使這種方法變得更慢,並且對於非常大的數據集來說可能無法容忍。這就是爲什麼大多數供應商提供他們自己的「批量加載器」方法,其中數據一致性和死鎖等內部處理速度更快。