0
我想知道如何找出我的文檔的開頭<html>
標籤是否具有Python中的特定關鍵字。我使用urllib和lxml作爲這個應用程序的另一部分,所以我試圖用它來實現它。找出<html>是否包含關鍵字
我現在所擁有的:
from urllib import urlopen
from lxml import etree
def get_amp_path(url):
document = urlopen(url).read()
tree = etree.HTML(document)
html = tree.xpath('//html')
for tag in html:
print etree.tostring(tag)
return
我想要做的就是返回true或false如果開<html>
標籤包含放大器關鍵字,像這樣<html lang="en" amp>
眼下它似乎打印html標籤的全部內容,而不僅僅是屬性。我如何使這更具體?
檢查'tree.attrib';你不需要'xpath'查找,因爲'html'應該已經是根元素了。 – tzaman
這個伎倆!謝謝 –