是否有可能通過jsdom(我使用它與Node.js + JQuery)來獲取多行屬性的值? 該網站刮包括該HTML: <li><a data-title="<strong>hello world
this is a test</strong>" href="example.org</strong>">A link</a></li>
不幸的是,這被解析到 <li><a data-title="
我看起來像當我通過jsdom運行頁面時,頁腳本中的$(document).ready塊沒有被執行。 下面是HTML: <html>
<body>
If everything works, you should see a message here: <h2 id="msg"></h2>
<script>
var checkpoint1 = true
va
更新: 我發現了,我沒能在運行jQuery的網頁所使用的標籤「基地」如果網站包含標籤jsdom是行不通的。雖然我不知道爲什麼。 <base href="http://bbs.18183.com/" />
爲了驗證這一點,我創建了一個全新的HTML文件,並把裏面,然後jsdom失敗。 我目前使用的是Node.js玩耍,讀書How to Scrape Web Pages with Node.js
我從https://github.com/sylvinus/node-crawler var Crawler = require("crawler").Crawler;
var c = new Crawler({
"maxConnections":10,
"callback":function(error,result,$) {
console.log(resu