2012-05-24 29 views
0

我已經下載yago.n3數據集搜索手段來獲得更小的RDF(N3)數據集

然而,對於測試我想對數據集的較小版本的工作(如數據集爲2 GB),而且即使我做了一個小小的改變,需要我花費很多時間進行調試。

因此,我試圖複製一小部分數據並創建一個單獨的文件,但是這不起作用並拋出詞法錯誤。

我看到了較早的帖子,但是較早的帖子是關於大數據集的,而我正在尋找較小的帖子。

有什麼辦法可以讓我獲得少量的相同數據集?

回答

3

如果您有一個RDF解析器來讀取您的yago.n3文件,那麼可以解析它並在單獨的文件上編寫儘可能多的RDF三元組,以便使用較小的數據集運行實驗。

如果您發現N-Triples格式的一些數據(即每行一個RDF三元組),您可以根據需要採用儘可能多的行,並使數據集儘可能小:head -n 10 filename.nt會給你一個10個三元組的小數據集。

+0

你能指點我一些很好的rdf資源嗎......我想我很清楚rdf的概念。感謝您的幫助。希望,你也會爲此提供幫助。 – user1354510

+1

看過這個:http://www.w3.org/wiki/DataSetRDFDumps? – castagna