我打開一個xml文件,使用lxml,並且在保存到一個新的xml文件之前已經做了大量編輯,所有這些工作正常。 在我打開的XML中,我有一個URL鏈接到一個網頁。在網頁中有一些值,我想記錄和使用我的開放式XML。我已經搜索,但無法找到從哪裏開始。打開xml文件,找到網址,打開鏈接並搜索值 - python lxml
親切的問候。
更新 -
我使用下面的代碼從我的XML閃耀的URL,這是工作。然後我就可以讀取所有的頁面到數據變量,打印精細:
url = tree.find("//video/products/product/read_only_info/read_only_value[@key='storeURL-GB']")
if url is not None:
url = url.text
data = urllib2.urlopen(url)
data = data.read()
print data
我怎樣才能找到埋藏在網頁中的特定字符串,這裏有一塊我想要得到的網頁數據的:
<div id="content">
<div class="padder">
<div id="title" class="intro">
<div class="left">
<h1>This is the title</h1>
<span rating-system="bbfc" rating-id="37" class="content-rating">15</span>
<h2>this is more text</h2>
</div>
<div class="right">
<a href="https://rthuere.erwerwer.ghty4e.fdfsdf.com" class="view-more">View More In Sci-Fi & Fantasy</a>
</div>
我需要獲得價值「查看更多科幻&幻想」或任何其他價值是存在的。
親切的問候。
給出一個示例xml和代碼,顯示你已經完成了。 – falsetru
查看ElementTree及其在Python文檔中的示例 – Mark