2011-09-07 24 views
1

我正在尋找一種強大的Java方法來測試文本片段是否爲quoted-printable encoded。最直接的方法是測試一個字符串是否包含與以下正則表達式匹配的字符序列:(=[A–F0-9][A–F0-9])|(=[\r][\n])(編碼字符+ =,換行符換行)。如何測試文本片段是否爲引用可打印編碼

+0

有沒有可靠的方式來檢測這給定一個任意的字符串片段,爲什麼你需要它?文本從哪裏來? –

+0

文本片段的示例可以在此處找到:http://en.wikipedia.org/wiki/Quoted-printable#Example。我工作的電子郵件數據庫 - http://www.isi.edu/~adibi/Enron/Enron.htm。一些電子郵件被引用 - 可打印編碼,其中一些不是。 – Skarab

+0

電子郵件標題指示編碼。 – tripleee

回答

3

我會否定測試;包含=的文本後跟除換行符或兩個十六進制數字之外的任何內容都不是QP;但這仍然是一個弱啓發式 - 有人可以把=3D放在未編碼的文本中,只是爲了它(我剛剛做到了)。底線:如果你不知道編碼,你不知道編碼。

+0

我正在慢慢地得出同樣的結論。謝謝。 – Skarab

相關問題