所以我試着去提取一行HTML的,看起來像這樣的值:BeautifulSoup犯規返回所有HTML
<input type="hidden" name="_ref_ck" value="41d875b47692bb0211ada153004a663f">
,並獲得價值即時通訊做:
self.ref = soup.find("input",{"name":"_ref_ck"}).get("value")
及其工作對我很好,但我給了我的一個朋友的程序進行測試,他得到這樣的錯誤:
Traceback (most recent call last):
File "C:\Users\Daniel\AppData\Local\Temp\Rar$DI85.192\Invent Manager.py", line 262, in onOK
self.main = GUI(None, -1, 'Inventory Manager')
File "C:\Users\Daniel\AppData\Local\Temp\Rar$DI85.192\Invent Manager.py", line 284, in __init__
self.inv.Login(log.user)
File "C:\Users\Daniel\AppData\Local\Temp\Rar$DI85.192\Invent Manager.py", line 34, in Login
self.get_ref_ck()
File "C:\Users\Daniel\AppData\Local\Temp\Rar$DI85.192\Invent Manager.py", line 43, in get_ref_ck
self.ref = soup.find('input',{'name':'_ref_ck'}).get("value")
AttributeError: 'NoneType' object has no attribute 'get'
這意味着臨時t beautifulSoup返回一個NoneType由於某種原因
所以我告訴他發送HTML的請求返回,這很好,然後我告訴他給我的湯,它只有頁面的頂部我無法弄清楚,爲什麼
這意味着BS是隻返回HTML其recieving的一部分
我的問題是,爲什麼或者如果有一個簡單的方法,我可以用正則表達式或別的東西,感謝做到這一點!
不要使用正則表達式的HTML。你使用bs4的後端是什麼? –
我剛纔說過,作爲例子和後端? – Serial
如果原始HTML文件內容已完成,那麼html代碼中可能有一些破碎的標籤? –