這個作品標籤...廣東話拉出來的文字使用BeautifulSoup
print soup.findAll('td',{ "class" : "green center" })
,但我只需要文本,這不會工作...
print soup.findAll('td',{ "class" : "green center" }).text
這裏是如何使用它的IM。
#!python27
import fileinput
import sys
import BeautifulSoup
from BeautifulSoup import BeautifulSoup
import re, urllib
filename = "url.txt"
LineNumber=0
f=open(filename)
lines=f.readlines()
f.close()
for line in lines:
filehandle = urllib.urlopen("http://kat.ph/usearch/"+lines[LineNumber]+"/")
line = filehandle.read()
soup = BeautifulSoup(line)
print soup.findAll('td',{ "class" : "green center" }).text
print soup.findAll('td',{ "class" : "red lasttd center" }).text
print LineNumber
LineNumber=LineNumber+1
filehandle.close()
發佈腳本url.txt只是一個要運行的搜索列表。
你看過錯誤信息嗎? ('ResultSet'沒有'text'屬性)這應該給你一個線索=) – katrielalex