我是nodejs的新手,我正在嘗試掃描我網站的所有網址(啓用javascript和jquery),並檢查URL是否包含給定的字符串。Jsdom爲某些URL拋出錯誤
要做到這一點我使用jsdom,但是當我啓動腳本中僅提取某些URL,然後崩潰給這個錯誤:
timers.js:110
first._onTimeout();
^
TypeError: Property '_onTimeout' of object [object Object] is not a function
at Timer.listOnTimeout [as ontimeout] (timers.js:110:15)
當然也有一些是錯誤的,但我不明白的地方。 。
這是我的腳本:
var request = require('request');
var jsdom = require('jsdom');
request({ uri: 'http://www.example.com' }, function (error, response, html) {
if (!error && response.statusCode == 200) {
var doc = jsdom.jsdom(html, null, {
features: {
FetchExternalResources : ['script'],
ProcessExternalResources : ['script'],
MutationEvents : '2.0',
}
});
var window = doc.createWindow();
jsdom.jQueryify(window, "http://code.jquery.com/jquery-1.5.min.js", function() {
var $ = window.jQuery;
$('a').each(function(i, element){
var a = $(this).attr('href');
console.log(a);
if (a.indexOf('string') != -1) {
console.log('The winner: '+a);
//return a;
}
});
window.close();
});
}
});
我有同樣的問題,但只在某些網站上。我還沒有確定是否是由於在被刮掉的html中腳本的實際執行引發的錯誤,或者它是jsdom代碼中的內部錯誤。標誌指向兩個現在:) –
我提出了一個拉請求按照@faridNouriNeshat的建議:https://github.com/tmpvar/jsdom/pull/1186 –