2013-01-23 113 views
2

我想使用Mechanize python庫來關注網站中的某些鏈接,但我感興趣的唯一鏈接是<div>標籤中的鏈接。 This問題是相關的,但他們使用我不熟悉的lxml解析器實現它,我更喜歡使用BeautifulSoup。以下鏈接與機械化

我已經找到了使用BeautifulSoup的相關鏈接,但我不知道如何使用Mechanize(或別的東西)來關注這些鏈接。有沒有辦法將一個字符串傳遞給機械化,以便它會遵循它?

回答

1

簡單open()應該足夠:

br.open('http://google.com') 
+1

這是一個容易得多,我認爲這將是! – Kitchi

1
import mechanize 
response = mechanize.urlopen("http://example.com/") 
content = response.read() #The content is the code of the page (html) 

或者,如果您要添加的東西像頭:

import mechanize 
request = mechanize.Request("http://example.com/") 
response = mechanize.urlopen(request) 
content = response.read() #The content is the code of the page (html)