我需要構建一個系統以從網頁集合中提取海量數據。很多這些網站(mayabe 90%左右)由各種不同的JavaScript系統提供支持。我想知道什麼是最有效的方法來提取這些數據?從javascript網頁中提取數據
由於每個站點都不同,我正在尋找一個靈活的解決方案,並且由於有許多站點,我正在尋找一種解決方案,儘可能減輕網絡壓力。
我的大部分編程經驗都是使用C,C++和Perl編寫的,但是我很樂意提供最好的結果。
網頁不斷更新我希望提取的數據和統計信息,並對其進行一些分析,因此我需要能夠輕鬆地將它們存儲在數據庫中。
我已經做了一些我自己的研究,但我真的在這裏空白。我希望別人能幫助我! :)
'刮'是非常不道德的。你想做什麼? – Halcyon 2011-04-25 09:49:07
一些關於博彩公司賠率變化的統計分析。 – dlmalloc 2011-04-25 10:04:17
您可能可以編寫一些正則表達式來提取數據部分。真的沒有多少。 – Halcyon 2011-04-25 10:10:02