我目前在coursera上學習Python專業。我遇到了使用BeautifulSoup從網頁中提取特定鏈接的問題。在這個網頁(http://py4e-data.dr-chuck.net/known_by_Fikret.html)中,我應該從用戶輸入中提取一個URL並打開後續鏈接,所有後續鏈接都通過錨定標籤標識並運行一些迭代。在Python 3.0中使用Beautiful Soup獲取特定鏈接的最有效方法是什麼?
雖然我能夠使用列表對它們進行編程,但我想知道是否有沒有使用列表或字典的簡單方法?
html = urllib.request.urlopen(url, context=ctx).read()
soup = BeautifulSoup(html, 'html.parser')
tags = soup('a')
nameList=list()
loc=''
count=0
for tag in tags:
loc=tag.get('href',None)
nameList.append(loc)
url=nameList[pos-1]
在上面的代碼,你會發現,使用「A」標記和「href」屬性定位的鏈接之後,我不能幫助,但必須創建一個名爲名稱列表來定位鏈接的位置列表。由於這是低效的,我想知道我是否可以直接找到URL而不使用列表。提前致謝!
@ skovorodkin謝謝! – aspiringroboticist