1
我嘗試在文本中查找以大寫字母開頭的單詞。但我不僅需要解析拉丁文字母。代碼 部分: - 字邊界 Java正則表達式 - 以大寫字母開頭的單詞 - 不僅拉丁文
\p{Lu}
- 大寫的Unicode信\p{L}*
String pattern = "[^[\\p{Upper}\\p{Lu}]\\w]";
Pattern r = Pattern.compile(pattern);
StringTokenizer itr = new StringTokenizer(value.toString());
while (itr.hasMoreTokens()) {
word.set(itr.nextToken());
Boolean m = word.toString().matches(pattern);
if(m)
{
uid.set(word);
context.write(uid, one);
}
}