2016-08-25 38 views
-2

我正在尋找從file.csv中的行導入URL,所以美麗的湯可以解析XML,但我不知道如何進行以下操作。從csv中的行導入URL爲beautifulsoup

url = row in 'file.csv' 
 

 
soup = BeautifulSoup(urllib2.urlopen('url').read() 
 

 
letters = soup.select('h1') 
 

 
print letters

+0

你問我g如何從csv文件讀取? –

回答

1

使用built-in csv module

import csv 
import urllib2 

with open("input.csv", "rb") as f: 
    reader = csv.reader(f) 

    for row in reader: 
     url = row[0] 

     soup = BeautifulSoup(urllib2.urlopen(url)) 
     letters = soup.select('h1') 
     print url, letters 

此代碼將工作作爲是,如果您有現有input.csv文件,你必須在每一行的第一個「細胞」的URL ,例如:

https://google.com,some_other_data,1 
https://stackoverflow.com,some_other_data,1