2012-08-09 43 views
0

我想解析一下phantomjs的英文版html源代碼。我是通過phantomjs解析一些HTML,如何設置我解析的語言?

以下是我的代碼:

var page = require('webpage').create(); 

if (phantom.args.length === 0) { 
    console.log('Usage: google.js keyword'); 
    phantom.exit(); 
} 

address = "http://www.google.com" 
keyword = phantom.args[0]; 

page.open(address, function (status) { 
    if (status !== 'success') { 
     console.log('FAIL to load the address'); 
    } else { 

     if (page.injectJs("jquery-1.3.2.min.js")) { 
      console.log("jQuery loaded..."); 
     } 

     console.log(page.content); 
    } 

    phantom.exit(); 
}); 

不過,我得到的是中國版,因爲我設在臺灣。我的平臺是Macbook Pro,Mountain Lion(英文版)。

如何更改我解析的語言?謝謝。

回答

1

您得到頁面的語言取決於網站的實施。如果網站根據您的位置決定語言,那麼情況會更糟糕。唯一的解決方法是使用英文區域的代理服務器。

UPDATE

在google.com的情況下,使用以下URL的

https://www.google.com/?hl=en 

代替

https://www.google.com/ 
+0

它確實使我的程序正常運行,謝謝。 – waitingkuo 2012-08-11 11:49:11