我對web開發相當陌生,以前從未做過任何屏幕抓取和網頁抓取,但昨天我的一個朋友問我是否可以抓取一些來自this網站的數據,這不是我的,也不是他的,但數據是公開可用的,甚至可以下載。 數據的問題是,它只能作爲一個文件每個日期或公司,而不是一個文件的多個日期或公司,這涉及到很多繁瑣的'點擊槽'日曆,所以他認爲這將是很好的如果我能夠創建一些應用程序,可以抓住所有的數據,只需點擊一下,並輸出到一個單一的文件或類似的東西。從ASP.NET webForm抓取數據
該網站使用aspx webFrom與__doPostBack檢索不同日期的數據,甚至在XSL中下載數據的鏈接並不是通常的「href = ...」鏈接,他們是,我假設,一些ASP腳本的參考...
說實話,我試過的唯一的事情是PHP cURL, t工作,但因爲我第一次嘗試cURL,我甚至沒有k現在,如果它不起作用,因爲它不可能與捲曲,或者只是因爲我不知道如何使用它。 我只是稍微精通PHP和JavaScript,但不是在ASP中,但我不介意學習新的東西。
所以我的問題是.. 是否有可能從這樣的網站抓取數據?如果是這樣,你會如此善意地給我一些關於如何解決這類問題的提示嗎?
的網站,再次在這裏http://extranet.net4gas.cz/capacity_ee.aspx
感謝
(唷,我的第一個問題..如果不遵守規則,請讓我知道,我會做的更好未來時間)
有可能在PHP,但它與Python Perl或紅寶石機械化容易得多。可能最簡單的是使用硒。 – pguardiario 2012-02-15 23:06:16