我對python很陌生。儘量在做項目時儘量學習,以保持興趣水平。循環播放項目並保存爲.xlsx文件,僅使用網頁抓取保存最後一個值?
在下面的代碼中,我試圖從網站上刮取信息,並將所有的公司名稱和地址等存入excel文件。我想我需要定義如何爲每個迭代/公司分配excel行和列。我只是想知道如何去做。
import requests, os
from bs4 import BeautifulSoup
from openpyxl import Workbook
from openpyxl import load_workbook
url = "https://dir.indiamart.com/search.mp?ss=Power+Distribution+Transformers"
r = requests.get(url)
soup = BeautifulSoup(r.content)
links = soup.find_all("a")
for link in links:
print("<a href='%s'>%s</a>" % (link.get("href"), link.text))
g_data = soup.find_all("div", {"class": "nes"})
c = []
d = []
for item in g_data:
c.append(item.contents[3].text)
d.append(item.contents[1].text)
wb = load_workbook("Trial.xlsx")
ws1 = wb.get_sheet_by_name("Sheet1")
for i in c:
ws1["A2"] = i
wb.save("Trial.xlsx")
for x in d:
ws1["B2"] = x
wb.save("Trial.xlsx")
您一直覆蓋相同的單元格並保存該文件。 –