我想知道是否有類似Scrapy for nodejs的東西?如果不是,你認爲使用簡單的網頁下載和使用cheerio解析它?有沒有更好的辦法。Scrapy就像Nodejs的工具?
5
A
回答
1
我還沒有見過如此強大的解決方案,用於在Python中抓取/索引整個網站,如Scrapy,所以我個人使用Python Scrapy來抓取網站。
但是對於從頁面中抓取數據,在nodejs中有casperjs。這是一個非常酷的解決方案。它也適用於ajax網站,例如角-js頁面。 Python Scrapy無法解析ajax頁面。 因此,爲了抓取一頁或幾頁的數據,我更喜歡使用CasperJs。
Cheerio確實比casperjs更快,但它不適用於ajax頁面,並且它沒有像casperjs這樣的良好代碼結構。所以我更喜歡casperjs,即使你可以使用cheerio包。
咖啡腳本實例:
casper.start 'https://reports.something.com/login', ->
this.fill 'form',
username: params.username
password: params.password
, true
casper.thenOpen queryUrl, {method:'POST', data:queryData}, ->
this.click 'input'
casper.then ->
get = (number) =>
value = this.fetchText("tr[bgcolor= '#AFC5E4'] > td:nth-of-type(#{number})").trim()
0
萬一你仍然需要一個答案, https://www.npmjs.org/package/scrapy 我從來沒有測試過它,但認爲它可以幫助。 快樂報廢。
相關問題
- 1. 第二個工具欄就像在郵件+工具欄上NSScrollView
- 2. 改進Scrapy抓取工具
- 3. WPF Popup的行爲就像辦公室的浮動工具欄
- 4. Scrapy命令行工具未安裝pip
- 5. Jquery工具提示,就像下拉菜單
- 6. 可可 - 捕捉鼠標就像screencapture工具
- 7. iOS工具欄就像一個標籤欄
- 8. 應用的NodeJS作爲CLI工具
- 9. nodejs的版本控制工具
- 10. Windows Azure平臺就緒測試工具
- 11. 如何實現就地工具提示
- 12. 在全局搜索工具上工作 - 就像在MAC上一樣
- 13. 可以在網絡上使用NodeJs,就像php
- 14. NodeJs壓力測試工具/方法
- 15. 是否有網絡調試工具欄的春天,就像在symfony和Django?
- 16. 是否有T-SQL的樣式檢查工具,就像FxCop到.net一樣?
- 17. 的SQLite就像%和_
- 18. 的NodeJS - 圖像
- 19. 在scrapy中放入我的抓取工具的參數
- 20. 顯示圖像具有不同大小就像一個表CSS
- 21. 像JSONLint.com XML的工具
- 22. 訪問像MySQL的工具
- 23. scrapy提取圖像
- 24. scrapy圖像問題
- 25. Scrapy圖像下載
- 26. NSTableView就像Finder
- 27. 就像是去?
- 28. $ addToSet就像$推
- 29. 就像OLX
- 30. 如何獲取由Python Scrapy工具捕獲的項目數量?
該模塊不能被配置。它只返回商家名稱和電話。我發現了一個可能的解決方案,而不像Scrappy那樣。但通過使用Cheerio可以操作頁面。就像使用Jquery一樣。 – user2422940 2014-12-02 17:59:20