我想爲我的程序構建索引,其中最重要的一步是對文本進行規範化。 例如我需要將「[(Mac Pro @apple)]」轉換爲「macproapple」,其中我過濾空格,標點([()])和特殊字符(@)。我的代碼是這樣的:java:如何正常化文本?
StringBuilder sb = new StringBuilder(text);
sb = filterPunctuations(sb);
sb = filterSpecialChars(sb);
sb = filterBlankSpace(sb);
sb = toLower(sb);
因爲這會產生很多String對象,我決定使用StringBuilder。但我不知道如何用StringBuffer來完成它。有沒有人有一些建議?我也需要處理漢字。
http://stackoverflow.com/questions/1805518/replacing-all-non-alphanumeric-characters-with-empty-strings – sgowd 2012-04-24 05:50:05
但StringBuffer的沒有按」 t有replaceAll方法 – remy 2012-04-24 05:53:49