我想用Pattern的編譯方法來做到這一點。如使用通用語言支持去除所有非字母數字字符的正則表達式?
String text = "Where? What is that, an animal? No! It is a plane.";
Pattern p = new Pattern("*some regex here*");
String delim = p.matcher(text).replaceAll("");
什麼是可以做我想要完成的正則表達式?
例字符串:
英語
Input: "Where? What is that, an animal? No! It is a plane."
Output: "Where What is that an animal No It is a plane"
西班牙
Input: "¿Dónde? ¿Qué es eso, un animal? ¡No! Es un avión."
Output: "Dónde Qué es eso un animal No Es un avión"
葡萄牙
Input: "Onde? O que é isso, um animal? Não! É um avião."
Output: "Onde O que é isso um animal Não É um avião"
希望的例子說清楚什麼,我試圖完成。 謝謝大家!
這暗示普通話是沒有意義的,因爲字符既不是元音也不是字母,而是合乎邏輯的聲音。至於你給我們的浪漫語言例子,你可能不得不手動列出所有事情。 –
每種語言都有自己的符號,它們出現在ASCII表格的不同位置。此外,您需要檢查它的細節並創建適當的連鎖,如[^ a-zA-Z0-9] –
非字母數字是\ W(除非您不想強調下劃線) – Vivick