2015-05-08 97 views
1

我很喜歡用Scrapy抓取大多數網站,但是我從來沒有試過從javascript獲取動態內容,而且我遇到了很多關於如何開始學習的論點。Python/Scrapy:刮掉納斯達克的數據?

我試圖從桌上刮收入數據:

http://www.nasdaq.com/symbol/scmp/revenue-eps

我聽到了很多關於硒,它是有用的(儘管許多人聲稱慢),我也聽說過飛濺與Scrapy,但文檔沒有說在Windows上安裝它,我正在使用Windows。

只希望從哪裏開始,任何推薦的教程等方面略有指導。

注意:我非常希望能夠使用Scrapy的方法,因爲我對Scrapy已經非常熟悉了。

回答

1

要使用飛濺只是使其與Scrapy中間件在配置:

DOWNLOADER_MIDDLEWARES = { 
    'splashtest.middleware.splash.SplashMiddleware': 725, 
} 

和匹配所有的URL(如果這就是你想要的)通過你的飛濺服務器:

SPLASH_URL_PASS = (r'.',) 

而且開始你的飛濺服務器:

python -msplash.server 

應該說有些人關心飛濺是基於在qt上。