我工作的公司將其前端切換到gwt應用程序,我想知道是否有可能編寫一個腳本(無論是與bash和wget或cURL,或Java或其他),使我下載gwt web應用程序的實際內容。因爲現在如果我嘗試使用諸如wget之類的命令,我只是使用一些javascript函數下載頁面,但沒有實際的頁面內容(我感興趣的內容)。我在質量保證方面,所以我想我很想知道是否有可能在沒有直接訪問開發者代碼的情況下執行這樣的任務。 謝謝!下載網頁谷歌網絡工具包
1
A
回答
0
我發現用一種叫做硒工具的解決方案。我能夠輕鬆點擊應用程序中的gwt應用程序記錄我的活動以供將來使用,並獲取應用程序生成的實際html,然後我可以解析所需內容並據此採取相應措施。唯一的小缺點是硒不需要使用htmlunit或httpunit,而需要使用瀏覽器。
1
GWT使用javascript構建頁面(DOM)。所以喲需要渲染初始DOM的東西,運行改變/生成元素的javascript,然後輸出整個DOM。基本上你需要一個瀏覽器。
你最好的選擇是尋找一個保存整個頁面的瀏覽器擴展。
0
以下是關於AJAX應用程序中的可爬行性的一般背景。
http://code.google.com/web/ajaxcrawling/docs/getting-started.html
這裏是通過餵養頁面到的HtmlUnit,導致所有的HTML被渲染,然後把結果發回給網絡爬蟲實現了爬行規範樣本servlet代碼。
相關問題
- 1. 谷歌網絡工具包
- 2. 谷歌網絡工具包與單軌
- 3. 谷歌網絡工具包引發java.security.AccessControlException
- 4. 谷歌網頁工具包 - 多頁
- 5. java +谷歌網絡工具包(谷歌應用程序引擎)
- 6. 在谷歌網絡工具包eclipse插件
- 7. 谷歌網絡工具包(GWT)可以遷移到AIX嗎?
- 8. 谷歌網絡工具包評估字符串
- 9. 掩碼java jsoup網絡爬蟲作爲谷歌機器人下載網頁
- 10. 谷歌網站索引(谷歌網站管理員工具)
- 11. 谷歌瀏覽器 - 開發人員工具 - 網絡面板
- 12. 谷歌網絡工具包 - 從Java發送字符串到JavaScript代碼
- 13. 谷歌網站管理員工具
- 14. 谷歌網站管理員工具API
- 15. 谷歌小工具和網站api
- 16. 谷歌網頁字體不能在網絡服務器上工作
- 17. 谷歌Apps腳本重定向在谷歌網站小工具
- 18. 谷歌Web工具包自動刷新電網
- 19. 將重定向頁面,谷歌網站管理員工具
- 20. 將谷歌小工具添加到網頁
- 21. 麪包屑與Schema.org在谷歌的豐富網頁摘要測試工具
- 22. 通過谷歌鉻/鉻在linux終端下載網頁
- 23. 谷歌網站管理員工具API:通過OAUTH2下載查詢
- 24. 谷歌網頁字體 - CSS
- 25. 谷歌地圖的網頁
- 26. 如何谷歌網頁
- 27. 谷歌網頁索引
- 28. 谷歌analistics.js爲一個網頁網站
- 29. 谷歌網站管理員工具:網站地圖不索引?
- 30. 谷歌網站管理員工具報告奇怪的網址
感謝您的回覆,我之前實現了HTMLUnit代碼,嘗試從我正在測試的應用程序生成html,但它不生成應用程序的任何實際body html,它只是返回頭部提及的內容javascript和css引用。我需要再看看這個,看看我是否可以調整服務器請求或類似的東西。我相信這是可以做到的,因爲使用螢火蟲我可以查看應用程式的HTML,我只是沒有想出HTMLUnit。 – mike 2011-06-03 16:06:46