我有一個小腳本,它使用urllib2
來獲取網站內容,查找所有鏈接標記,在頂部和底部附加一小段HTML,然後嘗試對其進行美化。它一直返回TypeError:序列項目1:期望的字符串,找到標籤。我環顧四周,我找不到問題。與往常一樣,任何幫助,非常感謝。無法在BeautifulSoup中對美化的html進行美化
import urllib2
from BeautifulSoup import BeautifulSoup
import re
reddit = 'http://www.reddit.com'
pre = '<html><head><title>Page title</title></head>'
post = '</html>'
site = urllib2.urlopen(reddit)
html=site.read()
soup = BeautifulSoup(html)
tags = soup.findAll('a')
tags.insert(0,pre)
tags.append(post)
soup1 = BeautifulSoup(''.join(tags))
print soup1.prettify()
這是追溯:
Traceback (most recent call last): File "C:\Python26\bea.py", line 21, in <module>
soup1 = BeautifulSoup(''.join(tags))
TypeError: sequence item 1: expected string, Tag found
是啊,這是追溯: 回溯(最近通話最後一個): 文件 「C:\ Python26 \ bea.py」,第21行,在 soup1 = BeautifulSoup( '' 加入(標籤)。) 類型錯誤:序列項目1:期望的字符串,標籤發現 –
Kevin
2010-01-07 17:03:52