2012-05-17 75 views
0

閱讀HTML網站的內容我使用Web客戶端:網頁抓取 - 如何閱讀網站的基礎內容上的SWF

WebClient client = new WebClient(); 
byte[] html  = client.DownloadData(url); 
UTF8Encoding utf = new UTF8Encoding(); 
return utf.GetString(html); 

的問題時,現場就像是www.bet365.com。賠率顯示在瑞士法郎。我如何讀賠率? 我無法通過Ctrl + U或Firebug在Mozilla中顯示該網站的內容。 IE(F12)檢查工作。

謝謝

+0

你可以做光學字符識別或OCR,即刮從圖像文本的方法,但你必須採取圖片的網頁,然後做OCR,然後用正則表達式來提取數據。但看起來像是矯枉過正,數據可能會損壞,因爲OCR遠沒有完美 – formatc

+0

oddsportal.com - thay以某種方式做 – Robert

+0

這聽起來像它可能會違反一些法律...... – RQDQ

回答

1

據我所知,你不能刮Flash內容。

但是,您可以執行的操作是嘗試使用代理工具(如FiddlerWireshark)嗅探由.swf啓動的HTTP流量,並祈求其未加密。

通過分析這些HTTP請求,您將能夠提取那些檢索數據並使用WebClientHttpWebRequest自動執行的數據。

但是,在自動提取數據之前,請確保允許並且您沒有違反任何網站條款和條件。

0

他們有一個XML提要他們給出來的附屬機構,沒有人刮自己的實際網站