1
我期待學習美麗的湯,並試圖從頁面提取所有鏈接http://www.popsci.com ...但我得到一個語法錯誤。爲什麼我的鏈接提取不起作用?
此代碼應該可以正常工作,但它不適用於我嘗試使用的任何頁面。我試圖找出爲什麼它不工作。
這裏是我的代碼:
from BeautifulSoup import BeautifulSoup
import urllib2
url="http://www.popsci.com/"
page=urllib2.urlopen(url)
soup = BeautifulSoup(page.read())
sci=soup.findAll('a')
for eachsci in sci:
print eachsci['href']+","+eachsci.string
...這是錯誤,我得到:
Traceback (most recent call last):
File "/root/Desktop/3.py", line 12, in <module>
print eachsci['href']+","+eachsci.string
TypeError: coercing to Unicode: need string or buffer, NoneType found
[Finished in 1.3s with exit code 1]
那好聽的作品真的,謝謝:) – Ninja2k