2011-06-10 72 views
1

我想向我的應用程序添加一個功能,該功能解析一個HTML頁面並依次跳轉到每個<a href="http:\\foo" >http請求的可接受率

我收集標題,描述和關鍵字關閉每個頁面加載和加載沒有別的,並不打算讓跳躍是多個深度。

這本身就是NSURLDownloadNSXMLDocument,但我想知道一個簡單的應用程序...

是否有不會讓我的應用程序看起來像一個DOS事件作爲,如果我只是流請求的可接受的速率以我從父頁面解析它們的速度發出子請求,然後我懷疑這會很快被檢測到。

回答

2

您應該符合the robots exclusion protocol。 RFC 2616規定了每個主機名2個併發請求的限制,然而現代瀏覽器超過了這個限制,這部分規範很可能會按照修訂。無論如何,NSURLConnection很可能會使用連接限制,但您應該檢查一下。