2013-05-31 34 views

回答

1
zegrep $'\tns:type\.object\.name\t.*Bush.*' freebase-rdf-<date>.gz | cut -f 1 

會給你哪些的名稱中包含字符串「布什」(從以前的例子),所有主題的MID的列表。

根據需要包括像別名,票友名稱匹配,等等

+0

感謝@湯姆擴展的正則表達式。這工作,但真的很慢。我可以想象40M實體並以這種方式在它們之間搜索可能很難。 – Knight

+0

我不知道我是否應該在評論中提出這個問題。但是,我會使用Google Topic Api來提取有關這樣的主題/實體的信息:'code'https://www.googleapis.com/freebase/v1/topic//m/09937。是否有可能從轉儲中獲得相同的輸出? – Knight