1
我在使用Python中的lxml解析JS時遇到了問題。當我執行下面的代碼,我的輸出是:使用lxml在python中解析html和js
「在0x10cec4e10 <元素DIV>」
from lxml.html.clean import Cleaner
cleaner = Cleaner()
cleaner.javascript = True
text = urllib2.urlopen("URL").read().decode("utf-8")
test = lxml.html.fromstring(cleaner.clean_html(text))
print test
我想要得到的是沒有JS的東西解析的文本。有人可以點亮一些光線嗎?謝謝。