所以我想檢查一個網站來更新我,只要有新的項目發佈。他們不經常更新,所以我相當確定他們什麼時候更新它將成爲感興趣的項目。我想通過選擇一個「起始數字」並計算頁面上的鏈接數量,然後每10分鐘將該數字與鏈接數量進行比較,直到鏈接數量大於起始數字爲止。使用一個功能的輸出作爲另一個功能的輸入
首先,我跑這來獲得鏈接的「起始編號」:
links=[]
for link in soup.findAll('a'):
links.append(link.get('href'))
start_num = len(links)
那麼現在這個數字比較鏈接的數量和每5秒:
notify=True
while notify:
try:
page = urllib.request.urlopen('web/site/url')
soup = bs(page, "lxml")
links=[]
for link in soup.findAll('a'):
links.append(link.get('href'))
if len(links) > start_num:
message = client.messages.create(to="", from_="",body="")
print('notified')
notify=False
else:
print('keep going')
time.sleep(60*5)
except:
print("Going to sleep")
time.sleep(60*10)
哪有我把所有這一切合併爲一個函數,我運行的時候可以存儲鏈接的起始數量,而不用每次檢查鏈接數量時都覆蓋它。
如果你想保留一個函數的狀態,你應該考慮使用類。 –