2013-11-23 10 views
0

我有使用客戶端驗證的站點以及像從客戶端一樣從其他站點獲取數據的更少的過程。我用vb在windows中完成了它(不允許使用第三方應用程序)。現在我想開始爲shell編寫相同的代碼。因爲我留在wget中,不在客戶端處理JavaScript。所以一些更好的應用程序內置於Shell或甚至Java與架構應該沒問題。如何使用高級dom處理和cient端的shell腳本進行報廢javascript處理

一個簡單的頁面獲取函數在vb中使用。因此,所有的客戶端處理後的網頁內容會被下載..

Function IEGetPage(URL) 
    Set IE = CreateObject("InternetExplorer.Application") 
    IE.Navigate URL 
    Do While IE.Busy 
    Loop 
    IEGetPage = IE.Document.Body.innerHTML 
    IE.Stop 
    IE.Quit 
End Function 

謝謝..

回答

0

我建議使用phantomjs。這使您可以在類似瀏覽器的環境中從Linux命令行外殼程序運行JavaScript。例如,你可以使用代碼像這樣搶一個HTML頁面,並分析其DOM:

var page = require('webpage').create(); 
page.open(url, function (status) { 
    if (status !== 'success') { 
     ... handle error ... 
    } else { 
     ... = page.evaluate(function() { 
      .. do something with document ... 
     }); 
    } 
    phantom.exit(); 
}); 
+0

對不起埃蒙,我錯過了一個點。這是shell,我只能使用Wget。所以獲得像Env這樣的瀏覽器的最好方法是通過unis JAVA庫並做到這一點..將嘗試。謝謝你的回覆。 – user3025817