所以我正在嘗試讀取HTML文件的內容以從特定網站上刪除某些元數據。在可可模仿瀏覽器中發出HTTP請求
但是我遇到的問題是,使用可可庫調用在objective-c中執行HTTP請求會給我一個不同的HTML文件,然後當我通過Web瀏覽器或我執行的python調用執行調用時。
這是令人討厭的原因是我颳了一個在每個請求上生成的密鑰。該網站似乎知道,當我通過可可而不是從python庫或從瀏覽器執行請求時。
任何人都可以對此有所瞭解嗎?
這裏是下面的Python代碼執行我:
self.url = 'http://sample-site.com/1?ax=1ts=123123.12'
request = urllib2.Request(complete_url)
response = urllib2.urlopen(request)
html_data = response.read()
這裏是下面的可可嘗試我試過:
NSString * completeUrl = [url stringByAppendingFormat:@"//%d?ax=1&ts=%1.2f", pageNumber, time];
的另一種嘗試:
NSMutableURLRequest* request = [[[NSMutableURLRequest alloc] initWithURL:hypeURL] autorelease]; [request setValue:userAgent forHTTPHeaderField:@"User-Agent"]; NSURLResponse* response = nil; NSError* error = nil; NSData* data = [NSURLConnection sendSynchronousRequest:request returningResponse:&response error:&error]; NSString *hypeHTML = [[NSString alloc] initWithData:data encoding:NSASCIIStringEncoding];
可可的嘗試正在檢索HTML,但HTML包含的關鍵值我分析了每次刷新時生成的關鍵值。然而,在使用cocoa執行請求時,每次執行應用程序時鍵值都不會改變(HTML中的鍵值相同),在Python中,HTML正確地爲每個請求使用不同的鍵。
感謝
請看看這篇博客我寫的描述了這個問題:http://www.fzakaria.com/2011/03/hypemachine-cocoa-woes/ – Setheron 2011-03-23 18:30:53