2
class MyHTMLParser(HTMLParser):
b1 = False
def handle_starttag(self, tag, attrs):
if tag =="ul":
self.b1 = True
def handle_data(self, data):
if self.b1:
print(data)
self.b1 = False
parser = MyHTMLParser()
parser.feed('<ul class="player-metadata floatleft"></ul><p>Gros caca</p><p>Zuul</p>')
我想<ul class="player-metadata floatleft">
和</ul>
這是空之間提取數據之間的提取物「空」的數據。然而,即使我舉報的<ul>
標籤,該handle_data
函數打印<ul class="player-metadata floatleft"></ul>
後找到的第一個數據:Python的HTMLParser的 - 兩個標籤
「格羅斯CACA」
我想打印的「一無所有」和len(data)
返回0
。
你能幫我嗎?我也不允許使用BeautifulSoup。
非常感謝。我希望我能夠upvote你的答案! 另外我相信你的意思是打印(self._data)的最後一行。 – connie246
是的,但你明白了。 ;) 很高興我能幫上忙。 –
我相信即使評分較低,您也可以接受答案,這會從問題中刪除[tag:unanswered]標籤。 –