1
我使用python編程,並使用美麗的湯來解析The History Channel's News Feed中的文章。到目前爲止,我可以弄清楚如何從單個文章中獲得文章文本,但我無法弄清楚如何從無限的feed中獲取鏈接。我嘗試插入RSS feed並使用feedparser,但只提供了20篇最新的文章。從無限大的網頁獲取所有文章鏈接?
有沒有辦法讓我失去更多? Pythonic方法首選!
我使用python編程,並使用美麗的湯來解析The History Channel's News Feed中的文章。到目前爲止,我可以弄清楚如何從單個文章中獲得文章文本,但我無法弄清楚如何從無限的feed中獲取鏈接。我嘗試插入RSS feed並使用feedparser,但只提供了20篇最新的文章。從無限大的網頁獲取所有文章鏈接?
有沒有辦法讓我失去更多? Pythonic方法首選!
在引擎蓋下,無限滾動通常是通過從可以直接從url訪問的分頁結果中注入記錄來處理的。使用Postman Interceptor,您可以發現分頁結果的url模式。
結果本頁面的第二頁是:http://www.history.com/api/html/news?sidebars=aetn_content&includejs=aetn_content&page=2
循環一翻和颳走!
非常感謝! –