2015-09-25 27 views
1

我正在使用dbpedia。在我的工作中,我的程序需要讀取dblook json文件(如http://dbpedia.org/data/Germany.json),並將所有信息作爲鍵值對提取,與dbpedia頁面(http://dbpedia.org/page/Germany)相同。但是我面臨一些問題。例如,如果您看到json文件(請使用一些json查看器來使其具有人類可讀性),如果我想要獲取語言(文件中的搜索語言),您將看到它在json數組中,所以我必須從數組中提取該信息。另一方面,如果你搜索seeAlso,那麼你會發現你必須先上一級並找到信息。此外,HTML頁面(http://dbpedia.org/page/Germany)中有一些信息,但在元數據json 文件(http://dbpedia.org/data/Germany.json)中未找到。例如,「birthPlace」在html頁面中,但不在json文件中。我完全困惑,我將如何編碼,可以讀取和存儲(作爲鍵值映射)數據就像在html頁面中看到的一樣。哪個是從dbpedia頁面檢索所有信息的正確方法?

回答

0

DBpedia數據按資源組織,其中每個「資源」是維基百科上的一個頁面,並且(可能)是現實世界中的一個頁面。每個資源都通過一個URL來引用。 JSON文件包含一大堆資源(如http://dbpedia.org/resource/Opel_Kadett_C),它們與您感興趣的資源有一些鏈接,其中包括http://dbpedia.org/resource/Germany。我認爲這應該包含http://dbpedia.org/page/Germany的所有信息,但顯然有些條目(如db:Anja_Kling)缺失。我不確定這是爲什麼,但它可能是一個錯誤 - 如果您在這裏沒有得到更好的答案,您應該嘗試通過電子郵件將您的問題發送到https://lists.sourceforge.net/lists/listinfo/dbpedia-discussion的dbpedia討論郵件列表。希望有所幫助!

相關問題