假設我想匹配正則表達式來查找文本中的域地址。 (包括子域如果有的話) 例如: 它應當匹配Python中的分組模式的替代正則表達式
abc.xyz.
google.
yahoo.
mail.google.
段:
pattern = '((\s*\w+.\s*)+)'
matches = re.findall(pattern,line)
for m in matches:
..
..
內括號將給M [0],它我不需要,我會只需要m [1]。 什麼是內部括號的替代,以便我得到我的結果m [0]。
PS: 有額外的匹配組()是混亂,我想避免使用它們,除非我需要這些特定的值。
你可以使用一個未命名的組,'((?:\ s * \ w +。\ s *)+)',這樣內部組不會被捕獲 –
[Python urlparse - extract domain名稱無子域](http://stackoverflow.com/questions/14406300/python-urlparse-extract-domain-name-without-subdomain) – Ben
@本,這是不重複的。我舉了一個例子,但問一個更廣泛的語法問題。 Hack.augusto的點數高於 – David