我試圖通過使他們的形式Firstname Lastlame
表明他們的名字。這適用於下面的代碼,但我希望能夠捕獲像Pär Åberg
這樣的國際名稱。我找到了一些解決方案,但他們確實不似乎不適用於Python風格的正則表達式。任何人都有這樣的感覺?匹配表單上的名字名字姓氏與國際字符
#!/usr/bin/python
# -*- coding: utf-8 -*-
import re
text = """
This is a text containing names of people in the text such as
Hillary Clinton or Barack Obama. My problem is with names that uses stuff
outside A-Z like Swedish names such as Pär Åberg."""
for name in re.findall("(([A-Z])[\w-]*(\s+[A-Z][\w-]*)+)", text):
firstname = name[0].split()[0]
print firstname
小心帶捕獲組和findall。 –
對於姓氏,您可以搜索空格之間的任何字符 – Onilol
嘗試're.findall(r'[AZ] [\ w - ] *(?:\ s + [AZ] [\ w - ] *)+')' –