2011-12-26 41 views
0

是否可以寫一個程序來獲取在線搜索結果?是否可以編寫一個程序來獲取在線搜索結果?

具體來說,我想從http://portal.uspto.gov/external/portal/pair

樣本數據的數據是申請號,例如9078871,10595401

是的,他們有驗證碼,我願意通過手動輸入這些英寸問題是我有超過500個申請號碼,我該怎麼辦?有沒有更簡單的方法來做到這一點?

在此先感謝!此外,搜索引擎似乎是用JavaScript編寫的,但我並不確定。

+0

鏈接中斷 – yurib 2011-12-26 10:06:42

+2

這就是已知的「刮」。你可以搜索「python scraping」或者參考如下內容:http://stackoverflow.com/questions/2081586/web-scraping-with-python – 2011-12-26 10:06:48

回答

0

當然這是可能的,爲什麼不應該。

我不知道你的知識差距會使你完成這項任務,因爲你沒有指出。

分步...

  1. 分析網站的代碼,看看如何鏈接和內容生成。
  2. 下載源代碼programaticly
  3. 生成超鏈接在搜索結果
  4. 解析相關的數據(我一直有一些醜陋的正則表達式這樣做)

我已經挖一點點您提到的網站以及真正可以說的是,由於它是用Java編寫的(JSP; Java服務器頁面),因此它不會是1小時的操作。

我到目前爲止發現的是,您首先必須編寫一個等效函數getDossier或使用Webbrowser控件,使您可以手動調用JavaScript來獲取搜索結果。然後,您可以簡單地烘焙一些正則表達式來解析表中的數據。

相關問題