2017-02-26 38 views
1

如何使用Python從DBpedia數據轉儲中獲取有關實體的信息?如何查詢DBpedia文件轉儲?

大多數職位目前計算器與端點的工作,並通過它不wuth使用SPARQL Endpoint interface to Python

使用它只是迭代的scikit學習的實施One數據轉儲文件(如https://datascience.stackexchange.com/questions/4873/querying-dbpedia-from-python),並把它們在字典中

例如,如果想要了解僅在info-box data dumps的屬性上在某個日期出生的名人。

我嘗試使用SPARQL端點接口來做同樣的事情,但顯然它不適用於數據轉儲。

+1

爲什麼在公共SPARQL端點可用時需要使用數據轉儲? - 你可能會有這樣的理由,在回答之前理解它們會很好。 – CaptSolo

回答

1

通常情況下,您可以將這些數據加載到RDF存儲區(如果您尚未安裝,請安裝一個)並使用SPARQL進行查詢。

通過這樣做,您將創建一個本地DBPedia鏡像。考慮到DBPedia已經提供了SPARQL端點,你有什麼理由不能只使用它?

這StackOverflow的答案提到你的選項設置本地DBpedia的鏡子:Why dbpedia result is not consistant

這一切都不是Python特定的 - SPARQL是RDF數據的標準查詢語言。

或者,您可以遍歷文件來查找所需的信息。這樣你鬆散的靈活性(「查詢」是你的代碼),但可以節省內存使用量。

+0

感謝您的輸入,您是否知道在哪裏可以找到更具體的端點,比如像轉儲這樣的特定數據集? – TJain

+1

您不需要更具體的端點 - 標準端點(例如http://live.dbpedia.org/sparql)包含來自大量DBPedia數據文件的數據,包括您提到的信息框數據集。 – CaptSolo