2012-07-11 45 views

回答

1
wget -O - http://download.freebase.com/datadumps/latest/freebase-simple-topic-dump.tsv.bz2 | bunzip2 | cut -f 2 > freebase-topic-names.txt 

雖然你可能想遊離鹼的ID,以及讓你知道什麼樣的名字是指:後期處理的

wget -O - http://download.freebase.com/datadumps/latest/freebase-simple-topic-dump.tsv.bz2 | bunzip2 | cut -f 1,2 

兩個額外的比特需要:

  1. 標籤被轉義的\ t
  2. 字符串\ N表示空(不存在)名稱
0

看看我們提供的Simple Topic Dump。它超過了GB的壓縮數據,但它的下載速度比嘗試通過API獲取所有名稱要快。

相關問題