我需要從HTML中取出電話號碼和電子郵件。獲取所有HTML數據EXCEPT mailto:和tel:在BS4中Python decompose()
我可以得到這些數據。
description_source = soup.select('a[href^="mailto:"]'),
soup.select('a[href^="tel:"]')
但我不想要它。
我想使用
decompose
description_source = soup.decompose('a[href^="mailto:"]')
我得到這個錯誤
TypeError: decompose() takes 1 positional argument but 2 were given
我曾經想過用
SoupStrainer
但它看起來像我將不得不包括除mailto和te之外的所有內容l至得到正確的信息......這個有點
滿當前的代碼是這樣的
import requests
from bs4 import BeautifulSoup as bs4
item_number = '122124438749'
ebay_url = "http://vi.vipr.ebaydesc.com/ws/eBayISAPI.dll?ViewItemDescV4&item=" + item_number
r = requests.get(ebay_url)
html_bytes = r.text
soup = bs4(html_bytes, 'html.parser')
description_source = soup.decompose('a[href^="mailto:"]')
#description_source.
print(description_source)
發佈您的完整代碼。 –