我必須編寫一個程序,它將從此鏈接中讀取HTML(http://python-data.dr-chuck.net/known_by_Maira.html),從錨標記中提取href =值,掃描相對於名字的特定位置中的標記在列表中,按照該鏈接並重復該過程若干次並報告您找到的姓氏。Python中的以下鏈接
我應該找到位置18(第一個名稱爲1)的鏈接,然後按照該鏈接重複該過程7次。答案是我檢索的姓氏。
這是我找到的代碼,它工作得很好。
import urllib
from BeautifulSoup import *
url = raw_input("Enter URL: ")
count = int(raw_input("Enter count: "))
position = int(raw_input("Enter position: "))
names = []
while count > 0:
print "retrieving: {0}".format(url)
page = urllib.urlopen(url)
soup = BeautifulSoup(page)
tag = soup('a')
name = tag[position-1].string
names.append(name)
url = tag[position-1]['href']
count -= 1
print names[-1]
我真的很感激,如果有人可以像你對我會以一個10歲,這是怎麼回事while循環中解釋。我是Python新手,非常感謝這一指導。
非常感謝你提前
哇!這真是一個很好的解釋! –