我正在Django Web框架中使用Python製作webscraping應用程序。我需要使用beautifulsoup庫來取消多個查詢。下面是代碼的快照,我已經寫了:如何在python中同時拋出多個html頁面與beautifulsoup?
for url in websites:
r = requests.get(url)
soup = BeautifulSoup(r.content)
links = soup.find_all("a", {"class":"dev-link"})
其實這裏網頁的抓取順序走,我想以並行的方式運行。我對Python中的線程沒有太多的想法。 有人可以告訴我,我怎樣才能以平行的方式進行報廢?任何幫助,將不勝感激。
多少網頁,你想在同一時間刮? – Exprator