-3
http://pslsource.com/buy_tennessee_titans_psl/我試圖用Node.js去掉一個網站,但是我被網站阻止了。我該如何解決這個問題?
這是我試圖報廢的網站。它有一些價格表,我不能通過我的Node應用程序訪問它(這是在Heroku上)。我如何重新訪問它?任何代理或其他建議?
下面的代碼,以及:
var Horseman = require("node-horseman");
var h = new Horseman({timeout: 50000});
h.open("http://pslsource.com/buy_tennessee_titans_psl/")
.waitForSelector("body")
.text("body")
.then(function(data) {
console.log(data);
});
注:所有的學分將支付給原網站,我不會要求該數據作爲我自己。
+1,這種類型的阻止通常會在您的抓取工具表現不佳時發生,例如,每秒請求數太多。 – Paul