2012-08-07 136 views
0

這是我如何緩存網頁,但我沒有得到整頁,有約30結果在這個網頁,我只得到26個結果。請任何人都可以幫助我?屏幕抓取Asp.net

WebClient wc = new WebClient(); 
html = wc.DownloadString("http://www.yellowpages.com/ga/metropcs-store?g=GA&page=1&q=Metropcs+Store").ToString(); 

是與如果任何人有這方面的任何解決方案最終請幫我

+2

字符串是否以「」結尾? – 2012-08-07 08:08:07

+1

你如何解析輸出? – dash 2012-08-07 08:08:31

+1

順便說一句,嘗試[YP API](http://developer.yp.com/api/Listings%2520Endpoints/Search-60) – 2012-08-07 08:11:11

回答

0

您提供正常工作的代碼。意味着返回的html完全包含30個項目。您所遵循的解析技術可能存在一些問題。當我檢查我發現在申請第28 29和30項目的CSS類略有差異。這可能導致問題

+0

我不認爲在CSS中有任何區別我用這個作爲我的解析事情MatchCollection m1 = Regex.Matches(html1,@「(?<= ] *> )。*?(?=)「,RegexOptions.Singleline);請幫我在這 – 2012-08-07 12:17:35

+0

項目i到27 css類的其中一個div是「排名引腳」。對於28,29和30,它只是「排名」。即使視覺差異是存在的(請檢查重新編號的頁面),最後三個項目沒有索引號的背景 – shajivk 2012-08-07 12:23:21

+0

我不使用該div的排名針我使用這個 4864吉米卡特大道, 所以沒關係是css的任何其他改變我提取這樣的數據MatchCollection m2 = Regex.Matches(html1,@「(?<= ] *>)。*?(?=)「,RegexOptions.Singleline); (每米平方m) Response.Write(m.ToString()+「
」); } – 2012-08-07 12:30:45