我在一個網頁上運行查詢,然後我得到結果URL。如果我右鍵點擊看到html源碼,我可以看到由JS生成的html代碼。如果我只是使用urllib,python無法獲得JS代碼。所以我看到一些使用硒的解決方案。這裏是我的代碼:如何通過使用硒獲取HTML呈現源代碼
from selenium import webdriver
url = 'http://www.archives.com/member/Default.aspx?_act=VitalSearchResult&lastName=Smith&state=UT&country=US&deathYear=2004&deathYearSpan=10&location=UT&activityID=9b79d578-b2a7-4665-9021-b104999cf031&RecordType=2'
driver = webdriver.PhantomJS(executable_path='C:\python27\scripts\phantomjs.exe')
driver.get(url)
print driver.page_source
>>> <html><head></head><body></body></html> Obviously It's not right!!
這裏的源代碼,我需要右擊窗口,(我想要的信息的一部分)
</script></div><div class="searchColRight"><div id="topActions" class="clearfix
noPrint"><div id="breadcrumbs" class="left"><a title="Results Summary"
href="Default.aspx? _act=VitalSearchR ...... <<INFORMATION I NEED>> ...
to view the entire record.</p></div><script xmlns:msxsl="urn:schemas-microsoft-com:xslt">
jQuery(document).ready(function() {
jQuery(".ancestry-information-tooltip").actooltip({
href: "#AncestryInformationTooltip", orientation: "bottomleft"});
});
===========所以我的問題=============== 如何獲取JS生成的信息?
什麼是你想要的HTML代碼看起來像在網頁上?你會想使用selenium的'get_element_by_ *'函數中的一個,但具體取決於html本身。 – Victory
我的意思是一切。例如,你在谷歌輸入的東西。在結果網頁中,右鍵單擊,查看源代碼。這就是我想要的「一切」。 – MacSanhe