2011-11-03 76 views
1

Freebase WEX dumps包含wpid列,該列對應於freebase_wpid表中源MediaWiki數據庫的page_id。此表提供維基百科數字文章/重定向ID和Freebase GUID(全局唯一ID)之間的映射。在MQL中獲取Wikipedia ID

​​使用外鍵由midlots of good reasons過時,但這並不改變GUID是在系統級別仍然使用,所以我打算從這裏叫mid的訪問的事實。使用mid訪問器在MQL中很靈活。可以使用"mid": null並使用"mid":[]進行查詢,具體取決於是否需要當前的mid或每個mid

查找每midwpid值的列表是直接在MQL:

[{ 
    "mid": null 
    "key": [{"namespace":"/wikipedia/en_id", "value":null}] 
}] 

但是,如果一切順利的宇宙中,每個電流mid應該只有一個電流wpid,那麼,有沒有辦法做到像"wpid": null像一個可以用mql訪問器?

回答

2

如果你只是想每個中旬一個wpid值,你可以做這樣的事情:

[{ 
    "mid": null, 
    "key": { 
    "namespace": "/wikipedia/en_id", 
    "value":  null, 
    "limit":  1 
    } 
}]​ 

Try it out

裸記住,這是完全可能的遊離鹼的話題將有一個以上的WMID 。無論何時我們需要合併我們從維基百科導入的重複主題,或者在維基百科中合併之前導入它們,都會發生這種情況。

如果您正在尋找鏈接維基百科的頁面,你可能也有興趣在/維基/ en_title namepace:

[{ 
    "mid": null, 
    "key": { 
    "namespace": "/wikipedia/en_title", 
    "value":  null, 
    "limit":  1 
    } 
}]​ 

Try it out

+0

多個wpid值的可能性就是爲什麼我希望可能會有一個較少的文檔訪問器,類似於中期。 –

+0

我不確定我是否遵循。你只是尋找一種不太複雜的方式來查詢wpids嗎?據我所知,你總是必須使用關鍵屬性。 –

+0

我不關心複雜,我關心準確性。 freebase mids在整個合併或分裂過程中都很有彈性,而在每個mid中挑選一個wpids的wpid不具有彈性。由於官方gui中有很多東西都與維基百科相關,所以我希望有一些中等魔法已經應用於wpid。 –