0
from urllib.request import urlopen
from bs4 import BeautifulSoup
import re
html = urlopen("http://www.bbc.co.uk/iplayer/live/bbcone?area=london")
bsObj = BeautifulSoup(html, "html.parser")
version = bsObj.find(string = re.compile('DOCTYPE html'))
if version in bsObj:
print("Yes")
else:
print("No")
我知道「http://www.bbc.co.uk/iplayer/live/bbcone?area=london」是HTML 5(!DOCTYPE HTML)DOCTYPE聲明,但是當我運行此腳本輸出是「否」。我究竟做錯了什麼?要打印的文檔類型聲明
''不是HTML標籤,但聲明和'find()'不適用於這些的全文。顯然。有關一些想法,請參閱http://stackoverflow.com/questions/2499358/get-document-doctype-with-beautifulsoup。 – kindall
@kindall - 這個問題看起來像它應該是一個愚蠢的,雖然我猶豫不決,因爲你沒有;-) ... – mgilson
我覺得這個問題不是一個嚴格的愚蠢,因爲它是問問'.find()'是什麼問題,而不是如何獲得文檔類型。 – kindall