2012-03-21 59 views
0

三月,13 www.cliws.com託管在谷歌應用程序引擎停止抓取HN的RSS源位於http://news.ycombinator.com/rss爲什麼urlfetch無法下載HackerNews RSS-feed(DownloadError:ApplicationError:2)?

www.cliws.com是RSS閱讀器像谷歌閱讀器,但好一點;)它會定期檢查各種RSS源,所以從日誌中我可以看到Google停止下載HN的RSS提要時的確切日期(之前它工作正常)。

有問題的RSS訂閱網址​​在開發SDK中本地提取時沒有任何問題,但無法在製作中下載。

請看到問題的波紋管示範:

s~cliwws> from google.appengine.api import urlfetch 
s~cliwws> print urlfetch.fetch('http://news.ycombinator.com/rss').status_code 
Traceback (most recent call last): 
    File "<console>", line 1, in <module> 
    File "/home/dogada/sources/python/google_appengine/google/appengine/api/urlfetch.py", line 263, in fetch 
    return rpc.get_result() 
    File "/home/dogada/sources/python/google_appengine/google/appengine/api/apiproxy_stub_map.py", line 592, in get_result 
    return self.__get_result_hook(self) 
    File "/home/dogada/sources/python/google_appengine/google/appengine/api/urlfetch.py", line 365, in _get_fetch_result 
    raise DownloadError(str(err)) 
DownloadError: ApplicationError: 2 
s~cliwws> print urlfetch.fetch('http://www.osnews.com/feed/kind/News').status_code 
200 
s~cliwws> print urlfetch.fetch('http://googleappengine.blogspot.com/atom.xml').status_code 
200 
s~cliwws> print urlfetch.fetch('http://google.com').status_code 
200 

我對這個問題也充滿錯誤:「http://code.google.com/p/googleappengine/issues/detail?id=7181」

這種奇怪行爲的可能原因是什麼?

回答

0

這裏只是猜測,但我認爲,由於標記的用戶代理,IP地址或其他元數據,Web服務器停止接受您的請求。請嘗試將用戶代理設置爲「Mozilla/5.0(X11; Linux x86_64)AppleWebKit/535.21(KHTML,如Gecko)Chrome/19.0.1042.0 Safari/535.21」以將用戶代理設置爲GAE測試是否改變任何東西。

+0

謝謝,@Michael,我已經改變了User-Agent,Accept- *,Cookie,Referer頭文件 - 不幸的是沒有效果。 – dogada 2012-03-22 10:16:51