我想匹配所有的內聯編碼在一個郵件主題和建立UTF8主題字符串。
一些例子:
[Listname | Topic123] =?utf-8?Q?encodedtext?=
=?iso-8859-1?q?this=20is=20some=20text?=
Klartext-Betreff
[Listname | Topic123] =?utf-8?Q?encodedtext?= =?iso-8859-1?q?this=20is=20some=20text?=
=?ISO-8859-1?B?SWYgeW91IGNhbiByZWFkIHRoaXMgeW8=?=
=?ISO-8859-2?B?dSB1bmRlcnN0YW5kIHRoZSBleGFtcGxlLg==?=
我也得到了一個郵件有兩個不同的編碼(最後一行中的例子)。
電子郵件中,也可能是可能的,即當被攝體在多行分割,其中每行(除了第一個)與至少一個空白
所以我要尋找一個正則表達式開始,它解析:
部分+
其中部分是一個:
- 文本與空間
- = ???charset編碼編碼文本=
我認爲沃爾去是這樣的:?
ENC = (=\?)([A-Za-z0-9-]*)(\?)([A-Za-z0-9-]*)(?)([Any Character])(\?=)
Part = any character that doesnt match to ENC or ENC
什麼語言或工具你有什麼嘗試? – squiguy 2013-03-04 04:26:04
語言:PHP,我會使用preg_match_all。我還沒有嘗試過任何東西,因爲我不知道如何形成該正則表達式 – Tobi 2013-03-04 04:29:21