2008-12-18 29 views
3

我想用正則表達式在字符串中查找英國郵政編碼。Python,正則表達式郵政編碼搜索

我已經拿到了正則表達式中使用RegexBuddy工作,見下圖:

\b[A-Z]{1,2}[0-9][A-Z0-9]? [0-9][ABD-HJLNP-UW-Z]{2}\b 

我有一大堆的地址,並希望從他們,下面的例子搶郵編:

123的一些路名
鎮,市

PA23 6NH

如何w ^我可以在Python中談論這個嗎?我意識到Python的re模塊,但我努力讓它工作。

乾杯

EEF

+0

您應該檢查:http://www.govtalk.gov.uk/gdsc/schemas/bs7666-v2-0.xsd 特別是「(GIR 0AA )|((([AZ-[QVX]] [0-9] [0-9])|(([AZ-[QVX] [AZ-[IJZ]] [0-9] [0-9 ])|(([AZ-[QVX]] [0-9] [A-HJKSTUW])|([AZ-[QVX] [AZ-[IJZ]] [0-9] [ABEHMNPRVWXY])) ))[0-9] [AZ- [CIKMOV]] {2})「爲標準正則表達式 – nicodemus13 2008-12-18 15:25:03

回答

5

重複您的地址與郵編PA23 6NH,PA2 6NH和PA2Q 6NH 3倍測試你的圖案,並使用正則表達式從對你的維基百科,代碼..

import re 

s="123 Some Road Name\nTown, City\nCounty\nPA23 6NH\n123 Some Road Name\nTown, City"\ 
    "County\nPA2 6NH\n123 Some Road Name\nTown, City\nCounty\nPA2Q 6NH" 

#custom                                    
print re.findall(r'\b[A-Z]{1,2}[0-9][A-Z0-9]? [0-9][ABD-HJLNP-UW-Z]{2}\b', s) 

#regex from #http://en.wikipedia.orgwikiUK_postcodes#Validation                        
print re.findall(r'[A-Z]{1,2}[0-9R][0-9A-Z]? [0-9][A-Z]{2}', s) 

結果是

['PA23 6NH', 'PA2 6NH', 'PA2Q 6NH'] 
['PA23 6NH', 'PA2 6NH', 'PA2Q 6NH'] 

這兩個正則表達式給出了相同的結果。

+0

由於我清楚我會修改正則表達式:'[AZ] {1,2} [\ dR] [\ DA-Z]? \ d [AZ] {2}' (\ d而不是[0-9],如果你的意思是「一個數字」,最好直接說出來。) – PEZ 2008-12-18 16:08:02

0

嘗試

import re 
re.findall("[A-Z]{1,2}[0-9][A-Z0-9]? [0-9][ABD-HJLNP-UW-Z]{2}", x) 

你不需要\灣

0
#!/usr/bin/env python 

import re 

ADDRESS="""123 Some Road Name 
Town, City 
County 
PA23 6NH""" 

reobj = re.compile(r'(\b[A-Z]{1,2}[0-9][A-Z0-9]? [0-9][ABD-HJLNP-UW-Z]{2}\b)') 
matchobj = reobj.search(ADDRESS) 
if matchobj: 
    print matchobj.group(1) 

輸出示例:

[[email protected]]$ python uk_postcode.py 
PA23 6NH