我正在使用bs4與python並試圖從網頁中獲取數據。 Link我在我想要的信息上使用了檢查元素,但都具有相同的標記類。Web刮,如何使用python中的bs4從兩個相同的標籤中提取數據
<a class="cell__value" data-tracker-action="click" data-tracker-label="information_technology.01" href="/markets/sectors/information-technology">
Information Technology
</a>
</div>
<div class="cell__return">
<div class="cell__label">
% Price Change
</div>
<div class="cell__value" data-type="better">
+0.05%
</div>
</div>
</div>
<div class="cell">
<div class="cell__name">
<div class="cell__label">
Industry
</div>
<a class="cell__value" data-tracker-action="click" data-tracker-label="information_technology.02" href="/markets/sectors/information-technology">
Software & Services
</a>
</div>
<div class="cell__return">
<div class="cell__label">
% Price Change
</div>
<div class="cell__value" data-type="worse">
-0.04%
</div>
</div>
</div>
</div>
我這樣做是這樣的:
sect= soup.find("a",{"data-tracker-label":"information_technology.01"})
print sect.text
sect_per= soup.find("div",{"data-type":"worse"or"better"})
print sect_per.text
ind=soup.find("a",{"data-tracker-label":"information_technology.02"})
print ind.text
ind_per=soup.find("div",{"div",{"data-type":"worse"or"better"})
print ind_per
都打印ind_per和打印ind_per是給我,因爲同一類標籤相同的結果
我需要分別和-0.04%提取+ 0.05%。
請建議我這樣做。
錯誤:name = cell.find(「a」,class _ =「cell__value」)。get_text(strip = True) AttributeError:'NoneType'對象沒有屬性'get_text' –
感謝您的支持。萬分感謝! –
還有一個問題@Zroq如果可以幫忙的話。如何轉換「截至7:05 AM EDT 3/24/2017」至yyyy/MM/dd hh:mm:ss在python中 –