我有一個字符串,它看起來像這樣之間:Python的 - 正則表達式的內容重複串
Q 1. What is your age?
Ans. 15.
Q 2. What is your name?
Ans. My name is Bond.
My full name is James Bond
Q 3. What is your favorite subject?
等等......這些問題的答案可以有多個段落。文本通常看起來像等等..我想寫一個正則表達式給我這些對。 我想分開問題答案對。我有一個正則表達式來輸出問題,但無法弄清楚如何獲得這些對。請指導。對於問題的正則表達式是:
p = re.findall("""Q [0-9]+[a-zA-Z]*\.(.*?)Ans\.""", checkText, re.S)
你需要用正則表達式來做到這一點?使用stringIO並遍歷行會不會更容易? – jprockbelly
@jprockbelly - 亞,這個文本是在一個HTML頁面,並且在這些問題之間還有其他字符串。將相應地更新問題。謝謝 – Tarun
如何解析HTML?使用lxml或BeautifulSoup – jprockbelly