我試圖從使用BeautifulSoup的HTML源提取數據。這是源如何處理其colspan ==''的td標籤?
<td class="advisor" colspan="">
這裏是我的代碼:
soup = BeautifulSoup(html, 'html.parser')
tds = soup.find_all('td')
for td in tds:
if td["colspan"] == '':
col = 0
else:
col = int(td["colspan"])
不過,我得到這個錯誤:
ValueError: invalid literal for int() with base 10: ''
我知道這個錯誤意味着'不能轉化爲整數,但爲什麼我的'如果'不工作?我認爲這種情況應該去
col = 0
而不是
col = int(td["colspan"])
你可以做'如果td [「colspan」]。strip()=='':'看看是否有幫助嗎? – shahkalpesh
可以包括'A,B,C,D,E,F'嗎? – Ian
@shahkalpesh它不起作用。你能告訴我什麼是strip()嗎?我以前在文檔中沒有看到它。謝謝:) –