使用re.split()
時我知道如何在分隔結果中保留分隔符,就是使用()
捕獲組。如何在re.split中保留分隔符在返回列表的相同索引上
但我有一個問題,這是我的正則表達式(<br>*\s*[a-z]+)
這裏是字符串
Attribute Information:</b><br>Listing of attributes:<br>>50K, <br>age: continuous.<br>workclass: Private, Self-emp-not-inc, Self-emp-inc, Federal-gov, Local-gov, State-gov, Without-pay, Never-worked.<br>fnlwgt: continuous.
返回從分裂的結果是
[u'<br>age', u': continuous.\r', u'<br>workclass', u': Private, Self-emp-not-inc, Self-emp-inc, Federal-gov, Local-gov, State-gov, Without-pay, Never-worked.\r', u'<br>fnlwgt', u': continuous.\r']
手段兩者都是在不同的索引[u'<br>age', u': continuous.\r']
編輯
其實我從這個URL http://archive.ics.uci.edu/ml/datasets/Adult 刮這部分 我想age: continuous.
和fnlwgt: continuous.
和他們都在不同的元素列表
你能否解釋一下要求?此外,您在示例輸出中有'\ r',但在共享示例輸入中沒有換行符。 –
@WiktorStribiżew查看編輯 – Umair
爲什麼不用'
'分割整個'p'標記值以獲得單獨的行?或者,我想你是在'r'
(?= \ s * [a-z - ] + :)之後',參見[this regex demo](https://regex101.com/r/Xhxont/2)。 –