我想這個URL刮:https://www.xstreetsl.com/modules.php?searchSubmitImage_x=0&searchSubmitImage_y=0&SearchLocale=0&name=Marketplace&SearchKeyword=business&searchSubmitImage.x=0&searchSubmitImage.y=0&SearchLocale=0&SearchPriceMin=&SearchPriceMax=&SearchRatingMin=&SearchRatingMax=&sort=&dir=asc我想用GAE刮網站和結果發佈到谷歌實體
進入每一個環節,並如提取出各種信息權限,元素等,然後將結果發佈到谷歌應用引擎上的實體。
我想知道最好的方法去呢?
克里斯
GAE提供了urlfetch模塊作爲繞過套接字開放限制的一種方式。 – 2010-03-09 03:57:10
@gnibbler:多數民衆贊成在知道:我想問題是,它將不會與我列出的任何框架開箱即用,所以這意味着從頭開始寫一些東西。雖然BeuatifulSoup仍然可以用來處理結果。感謝您的單挑+1。 – jkp 2010-03-09 05:17:12
你仍然可以在GAE上使用urllib2,但是它隨後被包裹在urlfetch中,並且刪除了一些功能 – hoju 2010-03-09 05:39:42