2017-08-29 71 views
2

我試圖抓取一頁來獲取網站分析數據。我在電子商務網站上做了虛擬購買。頁面上有一個事務ID,但是圍繞它的HTML不是理想的抓取,ID存在於未分類的標記中,沒有父類或父母父類的類,ID或其他有用屬性。如何查看錶單的來源

所以,我想查看源代碼並按Ctrl + F查看事務ID「123456」,看看它是否存在於dom的其他地方。

但是,當我查看源代碼時,我得到一個「確認表單提交」頁面,並且不會查看頁面後面的html。

如果在這些變量的任意位置有一個搜索所有全局變量的值爲「123456」的神奇方法,還要添加Javascript標記嗎?如果我在全局變量對象中找到了電子商務數據,那麼這將非常方便,而不是抓取HTML,在這種情況下,它只有很少的屬性可深入研究。

+0

使用Inspect元素代替「View Source」,你也可以在那裏使用Ctrl + F。這樣您將避免「確認表單提交」消息。 – yuriy636

+0

是的,我已經嘗試過了,但是在這種情況下只查看元素並沒有幫助,因爲沒有任何id或類或者父母可以抓取它。所以通過查看源代碼,我會查看它是否存在於其他任何地方,例如在JS對象中 –

回答

0

您可以將整個頁面保存爲HTML文件。在Chrome中,您只需按Ctrl + S,選擇您的目的地,然後在某些文本編輯器中編輯保存的文件。