限制GAE的返回大小url_fetch獲取方法？

我試圖抓住從網上存儲的MP3文件的Id3信息，而沒有抓住整個文件，並從大量的谷歌搜索最好的方法似乎是抓住文件的第一個夫婦KB然後從中獲取它。有沒有在谷歌應用程序引擎（python）的方式來從它的URL獲取文件的開始？限制GAE的返回大小url_fetch獲取方法？

喜歡的東西

rpc.size_limit = 4096 
rpc = urlfetch.create_rpc(deadline=10.0) 
    urlfetch.make_fetch_call(rpc, url, method=method, headers=headers, 
     payload=payload, allow_truncated=True) 
return rpc

感謝提前任何幫助。

來源

2012-09-22 tomatosource

找到了！你可以把在頭一個範圍，如果網站接受標題如下

headers["Range"] = "bytes = 0-4096"

或者你可以使用類似下面如果網站犯規像範圍頭（到目前爲止爲數不多的我試過都有）

host = 'http://www.wikipedia.org/somepath/tosome/file.mp3' 
req = urllib2.Request(host, headers={'User-Agent' : "Magic Browser"}) 
response = urllib2.urlopen(req).read(4*1024)

希望這可以節省一些時間在一個人的未來！

來源

2012-09-23 12:24:54 tomatosource

限制GAE的返回大小url_fetch獲取方法？

回答

相關問題