1
我使用python和lxml從鏈接負載中獲取div.article的內容。我想要div的實際html標記。但到目前爲止,我只能獲得剝去標記的鏈接的text_content()。使用lxml獲取div的HTML內容
doc = html.fromstring(doc_text)
article = doc.cssselect("div.article")
if len(article) > 0:
text = article[0].text_content()
data = {
'product':product,
'content': text,
}
任何人都可以幫我獲得文章[0]的標記嗎?
感謝
很好,謝謝! – iamjonesy 2013-03-12 09:12:14