我已經給了一個url,並且我想從url中提取<BODY>
標記的內容。 我正在使用Python3。我遇到了sgmllib
,但它不適用於Python3。用Python解析html標記
有人可以引導我與此?我可以使用HTMLParser
嗎?
這裏是我的嘗試:
import urllib.request
f=urllib.request.urlopen("URL")
s=f.read()
from html.parser import HTMLParser
class MyHTMLParser(HTMLParser):
def handle_data(self, data):
print("Encountered some data:", data)
parser = MyHTMLParser()
parser.feed(s)
這給了我錯誤:類型錯誤:無法將「字節」對象爲str隱含
「請指導我」:會做。搜索。有人問。很多很多次。在你完成搜索之後(在右上角),根據已經給出的答案,隨時詢問**特定的**問題。 – 2012-02-01 20:11:01
需要具體解析url中的parser.feed()方法嗎? – Nerd 2012-02-01 20:15:48
@ghbhatt:向我們展示您需要的一個示例。否則,請參閱我的回答是這是你問的。 – RanRag 2012-02-01 20:16:52