我想使用Python刮下面的網站,需要刮掉數據導出到一個CSV文件:如何用python抓取多頁網站並將數據導出爲.csv文件?
http://www.swisswine.ch/en/producer?search=&&
本網站包括154頁相關搜索。我需要打電話給每一頁,並且想要抓取數據,但我的腳本不能連續調用下一頁。它只刮一頁數據。
在這裏,我分配值我< 153因此,這個腳本只運行第154頁,並給了我10個數據。我需要從第1到第154頁的數據
如何通過一次運行腳本以及如何將數據導出爲CSV文件來從所有頁面中刪除整個數據?
我的腳本如下
import csv
import requests
from bs4 import BeautifulSoup
i = 0
while i < 153:
url = ("http://www.swisswine.ch/en/producer?search=&&&page=" + str(i))
r = requests.get(url)
i=+1
r.content
soup = BeautifulSoup(r.content)
print (soup.prettify())
g_data = soup.find_all("ul", {"class": "contact-information"})
for item in g_data:
print(item.text)
該刮數據線。否則,您完成循環並獲取循環後最後一個數據。 – chapelo
@vishnu使用BeautifulSoup很好。但是,如果你正在尋找整體管理,你應該去http://doc.scrapy.org/en/latest/intro/tutorial.html –