我想從這個網站拉角色名單,一旦我找到它Python3 BeautifulSoup返回串聯字符串
actors_anchor = soup.find('a', href = re.compile('Actor&p'))
parent_tag = actors_anchor.parent
next_td_tag = actors_anchor_parent.findNext('td')
next_td_tag
<font size="2">Wes Bentley<br><a href="/people/chart/
?view=Actor&id=brycedallashoward.htm">Bryce Dallas Howard</a><br><a
href="/people/chart/?view=Actor&id=robertredford.htm">Robert
Redford</a><br><a href="/people/chart/ view=Actor&id=karlurban.htm">Karl Urban</a></br></br></br></font>
的問題是,當我拉文則會返回一個字符串名稱之間沒有空格
print(next_td_tag.get_text())
'''this returns'''
'Wes BentleyBryce Dallas HowardRobert RedfordKarl Urban'
我需要這些名稱爲每個名字就像 [「韋斯賓利」,「布萊斯·達拉斯·霍華德」,「羅伯特·雷德福」,「卡爾·厄本」]
分隔的列表任何建議都非常有用。
你不能使用'find_all('a',...)'和'for-loop'而沒有'parent'和'findNext'嗎? – furas
請詳細說明。感謝您的格式編輯這是我的第一篇文章。 –
所以問題是,並非所有演員的名字都包含在一個標籤html中的許多名稱出現在
標籤之間,當我使用該方法時,它不允許我獲得'Wes Bentley' –