新手程序員和潛伏者在這裏,希望得到一些明智的建議。 :)什麼是數據挖掘關鍵字搜索結果總數的適當方法?
使用Python,BeautifulSoup和冰API的組合,我能找到我想要的東西用下面的代碼:
import urllib2
from BeautifulSoup import BeautifulStoneSoup
Appid = #My Appid
query = #My query
soup = BeautifulStoneSoup(urllib2.urlopen("http://api.search.live.net/xml.aspx?Appid=" + Appid + "&query=" + query + "&sources=web"))
totalResults = soup.find('web:total').text
所以我想跨越幾個做到這一點我應該採取不錘哪些步驟千個搜索詞,並想知道如果
- 這樣要求一千倍會被理解爲錘擊服務器,
- 表示服務器(最佳做法有哪些?),和
- 有沒有更便宜的(數據)方式來使用任何主要的搜索引擎API來做到這一點?
抓住所有這些數據只是爲了獲得每個關鍵字的一個數字並且我在想我是否錯過了任何東西。
FWIW,我做了一些家庭作業,並嘗試谷歌搜索API(不贊成使用)和雅虎的BOSS API(很快將被棄用並替換爲付費服務),然後與Bing API解決。我知道直接抓取頁面被認爲是糟糕的形式,所以我會直接通過搜索引擎來傳遞。
謝謝這就是我需要的一切(一次性研究請求)。 :-)欣賞你們給出的答案! – binarysolo 2011-03-10 20:33:10