我需要將dbpedia導入neo4j。 我從這裏下載dbpedia:http://wiki.dbpedia.org/Downloads37 任何想法?如何將dbpedia導入neo4j?
回答
或許可以從這個博客帖子得到一些幫助:http://blog.acaro.org/entry/dbpedia4neo
此用戶已經寫了一個腳本吧:
我目前在做同樣的事情。我發現最大的問題是編制索引,所以最好的解決方案是編寫一個Java程序,將md5散列語句提取爲三元文件,如下所示: subjectHash \ t predicateHash \ t objectHash \ t subject \ t predicate \ t對象\ n。
在另一個文件中,你將需要存儲節點(又名科目和報表的對象): nodeHash \ t的nodeValue
此過程中的代碼可以從我的github下載: https://github.com/eschleining/DbPediaImport.git
使用mvn包編譯它,並在目標中創建一個jar文件,該文件將gzip dbpedia文件作爲參數。如果你只有BZ2文件,你可以將他們喜歡如下: for i in *.bz2 ; do bzcat "$i" | gzip > "${i%.bz2}.gz"; done &
現在運行: java -jar ConcurrentDataTableWriter-0.0.1-SNAPSHOT.jar yourdbpediaFolder/*.gz
然後你新創建的文件手動與Linux的排序實用程序排序: gunzip -c nodes.gz | sort -k2 -u | gzip > nodes_unique.gz
和三元組文件: gunzip -c triples.gz | sort -k1,3,2 -u | gzip > triples_unique.gz
現在,您可以使用maven3(mvn軟件包)編譯我的回購的批量插件並在其中運行與nodes_unique.gz和triples_unique.gz文件具有相同的目錄,它創建一個名爲「DbpediaNe04J」的Neo4J數據庫目錄(介意拼寫錯誤「0」而不是o)。
我發現這是最快的方法,因爲它只查找三次中的每個主題/對象對的索引一次。
隨意將數據類型節點添加爲屬性等。我目前已經將每個三元組實現爲兩個節點之間的關係。
- 1. 如何將CSV導入neo4j
- 2. 如何將.zip數據導入neo4j?
- 3. 如何將.OWL文件導入Neo4J?
- 4. 如何在windows 7中將數據導入neo4j(neo4j-community-2.0.0)?
- 5. 將Gremlin Graphson導入Neo4j
- 6. 將Neo4J數據導入Gephi
- 7. 將數據集導入neo4j
- 8. Neo4j - 不能導入neo4j-import
- 9. 如何導入數據庫(檔案)neo4j
- 10. neo4j:如何從Oracle中導入數據
- 11. 用py2neo導入neo4j
- 12. Neo4j-導入失敗
- 13. Neo4j 3.0.3導入CSV
- 14. 導出和導入Json Neo4j
- 15. 將Neo4j數據導入Gephi 0.9.1
- 16. 將neo4j graphml導入orientdb問題
- 17. 將RDF(XML或Turtle)導入Neo4j
- 18. 將批量json數據導入neo4j
- 19. 將CSV關係導入到Neo4j
- 20. 我應該如何將DBLP xml文件導入neo4j?
- 21. 如何將Word文檔中的文本導入到Neo4j中?
- 22. 如何將Python節點字典導入neo4j?
- 23. 如何將Wordnet導入OrientDB,Neo4j等圖形數據庫?
- 24. 將GraphML導入Neo4j:如何指定節點標籤?
- 25. 如何將數據從sql導入到neo4j
- 26. 如何將csv文件導入到neo4j中NumberFormatException
- 27. 使用導入工具將TSV數據導入到Neo4j中
- 28. dbpedia/flash如何?
- 29. 將RDF/XML數據導入本地DBpedia設置
- 30. 如何將大量數據插入Neo4j
你會發現這個社會有用的答案: http://stackoverflow.com/questions/12212015/how-to-setup-neo4j-with-dbpedia-ontop-of-ruby-on-rails – 0x90
另外,我知道Kenny Bastiani在這方面做了一些工作。這似乎是一個相關的項目:https://github.com/kbastani/neo4j-dbpedia-importer –