我不想知道如何解決這個問題,因爲我自己解決了這個問題。我只是問它是否真的是一個錯誤,以及我是否和如何報告它。 可以找到的代碼和下面的輸出:HTMLParser誤解了href中的實體。這是一個錯誤還是不是?我應該報告嗎?
from html.parser import HTMLParser
class MyParser(HTMLParser):
def handle_starttag(self, tag, attrs):
for at in attrs:
if at[0] == 'href':
print(at[1])
return super().handle_starttag(tag, attrs)
def handle_data(self, data):
return super().handle_data(data)
def handle_endtag(self, tag):
return super().handle_endtag(tag)
s = '<a href="/home?ID=123>3=7">nomeLink</a>'
p = MyParser()
p.feed(s)
以下是輸出:
「?/家ID = 123> 3 = 7」
HTML格式錯誤;而'&'應該轉義爲'&'。解析器正在盡全力修復損壞。 – 2014-09-27 09:09:07