我以這種形式需要從表中的數據在文本文件(output.txt中): 數據1,數據2,數據3,數據4; .....解析表BeautifulSoup和文本文件寫
Celkova podlahova plocha bytu;33米; Vytah;肛; Nadzemne podlazie; Prizemne podlazie; ......;備考vlastnictva; Osobne
所有 「一行」,分隔符爲 「;」(後來在csv-出口文件)。
我是初學者。幫助,謝謝。
from BeautifulSoup import BeautifulSoup
import urllib2
import codecs
response = urllib2.urlopen('http://www.reality.sk/zakazka/0747-003578/predaj/1-izb-byt/kosice-mestska-cast-sever-sladkovicova-kosice-sever/art-real-1-izb-byt-sladkovicova-ul-kosice-sever')
html = response.read()
soup = BeautifulSoup(html)
tabulka = soup.find("table", {"class" : "detail-char"})
for row in tabulka.findAll('tr'):
col = row.findAll('td')
prvy = col[0].string.strip()
druhy = col[1].string.strip()
record = ([prvy], [druhy])
fl = codecs.open('output.txt', 'wb', 'utf8')
for rec in record:
line = ''
for val in rec:
line += val + u';'
fl.write(line + u'\r\n')
fl.close()
應該是 ';'。因爲在項目之間需要分號連接(店)。 – pwdyson 2010-02-09 09:44:03
哇,這太好了 - 但你有一個限制,只抓住第一個項目。如何繼續獲取表中的所有數據,包括嵌套表? – itsricky 2013-01-29 23:04:06