蟒蛇請求鏈接標題

2015-08-31 150 views 3 likes

我試圖找到最好的方式來捕獲響應頭下列出的鏈接，完全像這一個，我使用python requests模塊。以下是這對Python的鏈接頭部分鏈接請求頁面： docs.python-requests.org/en/latest/user/advanced/蟒蛇請求鏈接標題

但是，在我的情況，我的響應報頭包含類似下面的鏈接：

{'content-length': '12276', 'via': '1.1 varnish-v4', 'links': '<http://justblahblahblah.com/link8.html>;rel="last">,<http://justblahblahblah.com/link2.html>;rel="next">', 'vary': 'Accept-Encoding, Origin'}

請注意>在「最後」之後，在請求示例下並非如此，我似乎無法弄清楚如何解決這個問題。

來源

2015-08-31 user1819085

你的問題是什麼？ – Alik

如果我不清楚，請道歉，但是我想知道如何從響應中使用rel來響應下一個和最後一個鏈接。 – user1819085

如果請求不適用於這個'link'頭，那麼你可以手動解析它：這並不難。 – Alik

回答

您可以手動解析標頭的值。爲了使事情變得更簡單，您可能需要使用請求的解析函數parse_header_links作爲參考。

或者你可以做一些查找/替換和使用>,和<，那麼你需要做一個正則表達式替換原有之間parse_header_links

In [1]: import requests 

In [2]: d = {'content-length': '12276', 'via': '1.1 varnish-v4', 'links': '<http://justblahblahblah.com/link8.html>;rel="last">,<http://justblahblahblah.com/link2.html>;rel="next">', 'vary': 'Accept-Encoding, Origin'} 

In [3]: requests.utils.parse_header_links(d['links'].rstrip('>').replace('>,<', ',<')) 
Out[3]: 
[{'rel': 'last', 'url': 'http://justblahblahblah.com/link8.html'}, 
{'rel': 'next', 'url': 'http://justblahblahblah.com/link2.html'}]

如果有可能是一個空間或兩個。

來源

2015-08-31 15:43:52 Alik

這對我來說非常合適。 – user1819085

相關問題

11. TLSV1_ALERT_PROTOCOL_VERSION與蟒蛇請求包
12. URL請求，蟒蛇至R翻譯請
13. 蟒蛇鏈
14. 蟒蛇CSV標題錯誤
15. 蟒蛇manage.py collectstatic：boto.exception.S3ResponseError：400錯誤的請求
16. 轉換API請求響應蟒蛇
17. 蟒蛇，請求驗證的代理httplib.BadStatusLine
18. 壞請求錯誤翻譯蟒蛇
19. 數據請求字符串蟒蛇
20. 的AppEngine（蟒蛇味）請求源端口
21. 蟒蛇請求分塊響應
22. 蟒蛇龍捲風Get請求URL
23. 蟒蛇請求這裏地圖api
24. JSON發送POST請求與蟒蛇
25. 理解蟒蛇請求會話參數
26. 蟒蛇請求不能得到HTML
27. 蟒蛇請求從文件STATUS_CODE錯誤
28. 捲曲VS請求蟒蛇3
29. 捲曲蟒蛇請求轉換
30. 蟒蛇，請求保留功能