2010-03-29 64 views
3

機械化的Browser類很棒,它的follow_link()函數也很棒。但如何處理這種鏈接:Python機械化遵循圖像鏈接?

<a href="http://example.com"><img src="…"></a> 

有什麼辦法可以關注這樣的鏈接嗎?這種類型的鏈接的text屬性只是'[IMG]',所以AFAIK,沒有辦法區分這種鏈接。任何幫助,將不勝感激。

回答

5

跟着你需要添加NR參數follow_link()方法等環節。
試試這個:

import mechanize 
br = mechanize.Browser() 
br.open('http://www.systempuntoout.com') 
for link in br.links(): 
    print(link) 
br.follow_link(text='[IMG]', nr=0) 
print br 
>>><Browser visiting http://www.systempuntoout.com/quiz> 
br.back() 
br.follow_link(text='[IMG]', nr=1) 
>>><Browser visiting http://www.systempuntoout.com/about>