我有一個很大的字符串 - html頁面。我需要找到閃存驅動器的所有名稱,即 ,即我需要在雙引號之間獲得內容:data-name="USB Flash-drive Leef Fuse 32Gb">
。所以我需要一個data-name="
和">
之間的字符串。請不要提及BeautifulSoup,我需要在不使用BeautifulSoup的情況下完成,沒有正則表達式就更好,但是也可以接受正則表達式。Python。如何查找匹配子串的所有匹配項?
我試圖用這樣的:
p = re.compile('(?<=")[^,]+(?=")')
result = p.match(html_str)
print(result)
在HTML上使用DOM解析器來提取屬性的值有什麼問題? –
@Vasili Syrakis我有一定的任務 - 使用python。 –
fyi bs4 = python;看到這個鏈接的第一段:https://www.crummy.com/software/BeautifulSoup/bs4/doc/ –