2010-04-29 127 views
2

我在ASPX中動態生成表時遇到困難。試圖從這樣的網站上剔除天然氣價格GasPrices。我可以提取天然氣價格表中的所有信息(地址,提交時間等),但實際天然氣價格除外。使用Python刮* .aspx內容

有沒有一種方法可以削減汽油價格?即以某種方式得到它的文本表示。我對ASP/ASPX不是很熟悉,但是現在生成的東西並沒有在最終的HTML中顯示出來。我使用Python做刮擦,但這是無關的,除非有一個特定的庫...

在此先感謝。

+0

天然氣價格是多少?那是什麼鏈接? – ash 2010-04-29 23:38:13

+0

哎呀。錯誤的鏈接。固定。 – tomato 2010-04-29 23:39:14

+0

http://stackoverflow.com/questions/2741420/scraping-aspx-content-using-python – 2010-04-29 23:54:40

回答

4

頁面的起源(aspx)在這裏不是問題。

看起來他們正在積極嘗試阻止刮蹭嘗試。這些數字不是字體,而是他們的幾個div元素,其中background images是數字。 他們真的不想被刮。

(當然,如果你真的確定你很可能映射類名的div來......他們並不是很好「加密」)

拿筆記的版權通知在鏈接頁面的底部

+0

可能的重複同意,他們用圖像編碼他們的價格的事實表明他們不想被刮。你應該尊重這一點。 – 2010-04-29 23:52:12

+0

絕對會尊重那個。謝謝。 – tomato 2010-04-30 00:20:34