2015-10-04 79 views
0

我在做網頁抓取。實際上,我在節點中使用request module,現代網站正在使用Angular,EmberJS等較新的框架並生成html。當我用請求加載頁面時,文檔還沒有準備好,所以我只得到javascript代碼而不是HTML代碼。請求模塊等待文檔準備好

可能產生超時,然後加載頁面?

回答

0

request模塊只是一個HTTP客戶端,它只會讓你從一個特定的URL返回的文本。實現你想要做的一個簡單的方法是用像PhantomJS(https://github.com/sgentle/phantomjs-node)這樣的無頭瀏覽器打開URL,並在評估其內容之前實際執行該頁面。

+0

但是Panthomjs不是nodejs的庫 – user3307176

+0

我的答案中的鏈接是提供與PhantomJS綁定的節點的庫,以便您可以與節點上的正在執行的頁面進行交互以檢索內容。 – lukewestby

+0

好的,謝謝,我會盡力而爲 – user3307176