2017-04-18 39 views
14

實施例:กิิิิิิิิิิิิิิิิิิิิก้้้้้้้้้้้้้้้้้้้้ก็็็็็็็็็็็็็็็็็็็็ก็็็็็็็็็็็็็็็็็็็็กิิิิิิิิิิิิิิิิิิิิก้้้้้้้้้้้้้้้้้้้้ก็็็็็็็็็็็็็็็็็็็็กิิิิิิิิิิิิิิิิิิิิก้้้้้้้้้้้้้้้้้้้้กิิิิิิิิิิิิิิิิิิิิก้้้้้้้้้้้้้้้้้้้้ก็็็็็็็็็็็็็็็็็็็็ก็็็็็็็็็็็็็็็็็็็็กิิิิิิิิิิิิิิ ิิิิิก้้้้้้้้้้้้้้้้้้้้ก็็็็็็็็็็็็็็็็็็็็กิิิิิิิิิิิิิิิิิิิิก้้้้้้้้้้้้้้้้้้้้(或任何「zalgo」文本)如何檢查郵件中是否有組合字符?

我一直沒能完全弄清楚什麼辦法來檢查這些。我正在做一種反垃圾郵件,我不認爲需要保留這些垃圾郵件,因爲它們可能會滯後用戶,而且通常只是垃圾郵件。

我試圖做的是

if (getMessage().getRawContent().contains(combined character).delete(); 

如果有人知道一個簡單的方法來檢查組合字符,請張貼!

如果您對我所問的內容感到困惑,我可以進一步解釋並在需要時顯示更多示例。

+0

它只是我的瀏覽器或是問題的目的是這樣http://imgur.com/a/zNR17?奇怪的AF o.O –

+4

@JorgeCampos我很確定這是故意的。問題在於如何檢測組合字符的濫用情況。 – VGR

+1

@Jorge:我也是,讓我們說一下:這真是一件很棒的事!等待承諾**更多例子**。是的,我們需要! – statosdotcom

回答

11

有很多情況下,一個或兩個連續的組合字符是完全有效的文本。我會尋找他們中的四個或更多:

if (getMessage().getRawContent().matches(".*\\p{Mn}{4}.*")) 
+0

是的,我會試試這個結果並回來! –

+0

工作完美,謝謝! –

相關問題