2015-07-12 23 views
0

我想在chrome檢查元素上提取網站的完整html源代碼。如何從網站中提取源代碼,因爲我們在檢查元素中看到的內容

我想廢鋼disqus的意見從http://bossip.com/1190557/cops-kill-people-mississippi-cop-under-investigation-for-strangling-unarmed-black-man-jonathan-sanders-to-death-43081/

起初我試圖用Java和Jsoup但我無法提取完整的HTML源。

然後如How to get html that I see in inspect element?建議我嘗試使用HTML單元,但不幸的是HTML單元也沒有按照我的預期提取。

有沒有解決這個問題的方法?

+0

「頁面另存爲」,在你的瀏覽器? –

+0

有沒有Java庫可以做到這一點? –

+0

@ Nick.McDermaid即使手動保存,我沒有找到預期的內容,我在谷歌Chrome –

回答

-1

在Chrome中,

    正常的瀏覽器文件中
  1. :元素上單擊鼠標右鍵,然後從彈出菜單中選擇「檢查元素」。您將轉到「開發人員工具」窗口。
  2. 在開發人員工具窗口中:右鍵單擊HTML元素並從彈出菜單中選擇「編輯爲HTML」。
  3. 選擇在編輯器中(按Ctrl-A)的所有HTML文本複製到剪貼板(按Ctrl-C)
+1

不知道爲什麼這是downvoted。它按照所述的方式工作 – geert3

+0

因爲@Arun Kishore詢問如何獲得一個非常特定頁面的html,所以你的解決方案效果很好,但倒票可能是由於這是一個手動任務。它不能自動化。 –

相關問題