我正在嘗試編寫一個Python腳本來檢索文章是否有作者。Python - 檢索文章是否有作者
我寫了下面:
s = "https://www.nytimes.com/2017/08/18/us/politics/steve-bannon-trump-white-house.html?hp&action=click&pgtype=Homepage&clickSource=story-heading&module=a-lede-package-region®ion=top-news&WT.nav=top-news"
def checkForAuthor():
r = requests.get(s)
return "By" in r.text
print(checkForAuthor())
的問題是,函數返回checkForAuthor
即使true
時,有沒有作者,因爲它搜索單詞整個HTML內容。 找到作者而不搜索整個文檔有更好的邏輯嗎?比如在標題內搜索,所以我甚至不需要搜索文章內容。我確實需要製作這個通用的搜索引擎,以便我搜索到的任何網站都能給出結果。不確定那裏有什麼東西。
你應該有一些適當的庫解析HTML和檢查只有標籤喲你對此感興趣。 –