我想使用scrapy內的重新模式來解析字符串。該字符串具有以下格式。我試圖檢索字體標籤內的數字(例如08:00
)。易於在一個列表(\d+:\d+)+
做,但我需要兩個單獨的名單AM
和PM
。你只能通過創建兩個子字符串來實現 - AM
和PM
- 然後針對每個子字符串運行該模式? (AM -
和(PM -
是獨一無二的。感覺你應該能夠直接做到,但我沒有想法。謝謝。Python重新字符串解析
例如輸入:
(AM – 07:00 <font color=#0002fe>08:00</font> <font color=#0000dd>09:00</font> <font color=#0001fe>10:100</font>) <br> (PM – 18:00 <font color=#0000fe>190:00</font> <font color=#0000fe>175:00</font>)
謝謝您的答覆。恐怕我原來的帖子不夠清晰。提供的字符串是一個示例,但是包含許多其他標記inc的較大字符串的一部分。
標籤如此分裂的方式建議不是一種選擇。關於BeautifulSoup,我沒有使用它,所以我認爲使用re可以更容易地將這兩個部分提取到子字符串中並按照指示解析它們。再次感謝。 – john