2012-09-22 37 views
2

我試圖抓住從網上存儲的MP3文件的Id3信息,而沒有抓住整個文件,並從大量的谷歌搜索最好的方法似乎是抓住文件的第一個夫婦KB然後從中獲取它。有沒有在谷歌應用程序引擎(python)的方式來從它的URL獲取文件的開始?限制GAE的返回大小url_fetch獲取方法?

喜歡的東西

rpc.size_limit = 4096 
rpc = urlfetch.create_rpc(deadline=10.0) 
    urlfetch.make_fetch_call(rpc, url, method=method, headers=headers, 
     payload=payload, allow_truncated=True) 
return rpc 

感謝提前任何幫助。

回答

1

找到了!你可以把在頭一個範圍,如果網站接受標題如下

headers["Range"] = "bytes = 0-4096" 

或者你可以使用類似下面如果網站犯規像範圍頭(到目前爲止爲數不多的我試過都有)

host = 'http://www.wikipedia.org/somepath/tosome/file.mp3' 
req = urllib2.Request(host, headers={'User-Agent' : "Magic Browser"}) 
response = urllib2.urlopen(req).read(4*1024) 

希望這可以節省一些時間在一個人的未來!