我的目標是從XML文檔(鏈接)拉的網址,並把它們放在一個列表: https://www.valuespreadsheet.com/iedgar/results.php?stock=NFLX&output=xml如何基於兄弟標籤的價值提取lxml.etree標籤文本
我進口etree
從lxml
和創建了一個列表理解,從所有<instanceUrl>
標籤中提取文本。
url = 'https://valuespreadsheet.com/iedgar/results.php?stock=NFLX&output=xml'
et = etree.fromstring(urlopen(url).read())
return [_.find('instanceUrl').text for _ in et.find('filings')]
現在,我要限制的列表,以便只拉從<instanceUrl>
標籤,其中<formType>
= 10K的文本。
我該如何做到這一點?
另請參閱:http://stackoverflow.com/questions/38845273/can-you-permanently-change-python-code-by-input?noredirect=1&lq=1 – boson