0
我想提取一些信息使用python webscrapping python中美麗的湯。這是部分。我使用錯誤nonetype對象沒有屬性文本,而通過美麗的湯報廢4 python
<div class="result-value" data-reactid=".0.0.3.0.0.3.$0.1.1">
<span data-reactid=".0.0.3.0.0.3.$0.1.1.0">751</span>
<span class="result-value-unit" data-reactid=".0.0.3.0.0.3.$0.1.1.1">KB</span>
</div
Snap: https://www.dropbox.com/s/d349tb3f22o0wyf/4.png?dl=0
代碼是這樣
Sizeofweb=""
try:
Sizeofweb= soup.find('span', {'data-reactid': ".0.0.3.0.0.3.$0.1.1.0"}).text
print Sizeofweb
except StandardError as e:
converted_date="Error was {0}".format(e)
print converted_date
錯誤
nonetype object has no attribute text
我都試過,但沒有工作。我錯在哪裏?
它可能與您使用「lxml」解析器的事實有關。不同的解析器會以不同的方式處理HTML結構,並且一個解析器可能比另一個解析器更好地處理缺少的結束標記。 BeautifulSoup的文檔強調了不同解析器之間的差異 - https://www.crummy.com/software/BeautifulSoup/bs4/doc/#specifying-the-parser-to-use。 – TheF1rstPancake
好點@ Jalepeno112把一個體面的html字符串總是更明智,雖然...不知道這一個謝謝! –