對不起,如果它太基本。我想刮一個網站,其中涉及點擊頁面上的鏈接,並獲得最終的HTML。我讀了關於名爲JSDOM的nodejs模塊,我認爲它是爲此目的而構建的。Jsdom webscrapping
任何人都可以請指導我在正確的方向(博客或一些文件),因爲我找不到任何有價值的東西。
編輯1:
我一直在使用cheerio,但它不執行該功能。我發現這三個環節http://okfnlabs.org/blog/2013/01/15/web-scraping-with-node-css-selectors.html
http://liamkaufman.com/blog/2012/03/08/scraping-web-pages-with-jquery-nodejs-and-jsdom/
http://reustle.io/blog/simple-site-scraping-with-nodejs-and-jsdom
沒有這些鏈接顯示如何實際使用頁面上JS操縱JSDOM只與DOM操作交易。
這個問題不是太基本,但它會被低估,因爲你沒有顯示研究工作,而且它太寬泛。 –