1
根據Freebase,他們有23,407,174個主題。所有這些TOPIC的界面友好名稱(主要是主題JSON的'text'屬性,單個主題JSON的示例是here)的最簡單方法是什麼?我不需要任何其他元信息。從Freebase獲取所有主題名稱列表
根據Freebase,他們有23,407,174個主題。所有這些TOPIC的界面友好名稱(主要是主題JSON的'text'屬性,單個主題JSON的示例是here)的最簡單方法是什麼?我不需要任何其他元信息。從Freebase獲取所有主題名稱列表
wget -O - http://download.freebase.com/datadumps/latest/freebase-simple-topic-dump.tsv.bz2 | bunzip2 | cut -f 2 > freebase-topic-names.txt
雖然你可能想遊離鹼的ID,以及讓你知道什麼樣的名字是指:後期處理的
wget -O - http://download.freebase.com/datadumps/latest/freebase-simple-topic-dump.tsv.bz2 | bunzip2 | cut -f 1,2
兩個額外的比特需要:
看看我們提供的Simple Topic Dump。它超過了GB的壓縮數據,但它的下載速度比嘗試通過API獲取所有名稱要快。