2016-12-20 93 views
3

我們正在研究一個用知識庫回答問題的研究項目。我們採用了數據集SimpleQuestions(https://research.fb.com/projects/babi/)。 我們將最新的freebase數據轉儲加載到Virtuoso中,並通過mids(使用關係type.object.name和common.topic.alias)查詢實體的名稱。但是,無法找到許多實體的名稱。在Freebase中找不到實體名稱

我們也使用Semper提供的KB(https://github.com/percyliang/sempre),在這裏我們可以找到更多的實體名稱,但不是全部。 我們猜測這些實體可能會被刪除,這是真的嗎?如果是這樣,我們該如何繼續解決這個問題呢?

回答

1

Freebase API已經是depreciated並且不可能獲取實體名稱。但是,Google爲210萬個實體提供了Freebase/Wikidata Mappings。這些映射可用於將freebase實體映射到wikidata實體並獲取其實體名稱和其他信息。

此外,http://sameas.org/爲freebase實體提供了一些額外的映射。

編輯: 您還可以閱讀Freebase Dump以獲取這些映射。我親自使用以下屬性來獲得相應的實體名稱:

ENTITY_GET_LABEL_ORDER = [ 
    '<http://rdf.freebase.com/ns/type.object.name>', 
    '<http://rdf.freebase.com/ns/common.topic.alias>', 
    '<http://rdf.freebase.com/key/en>', 
    '<http://rdf.freebase.com/key/wikipedia.en>', 
    '<http://rdf.freebase.com/key/wikipedia.en_title>', 
    ] 

而且,即使這樣做後,有一個良好的數額(〜1-5k,不記得它到底),我們無法中音映射到名稱,並且可以安全地刪除這些(僅少數這樣的)問題。 Google還提供了一個包含一些刪除元組的附加轉儲。

相關問題