1
我在python下面編寫了一個非常簡單的網絡爬蟲程序,但是當我運行它時,它返回我 'NoneType'對象不可調用',你能幫我嗎?簡單的網絡爬蟲
import BeautifulSoup
import urllib2
def union(p,q):
for e in q:
if e not in p:
p.append(e)
def crawler(SeedUrl):
tocrawl=[SeedUrl]
crawled=[]
while tocrawl:
page=tocrawl.pop()
pagesource=urllib2.urlopen(page)
s=pagesource.read()
soup=BeautifulSoup.BeautifulSoup(s)
links=soup('a')
if page not in crawled:
union(tocrawl,links)
crawled.append(page)
return crawled
crawler('http://www.princeton.edu/main/')
您可以發佈完整回溯?這應該至少縮小「None」值的函數調用的範圍。 – Blckknght