我想提取句子中的名詞,並從POS標籤提取從POS標籤的名詞性詞語與原句
//Extract the words before _NNP & _NN from below and also how to get back the original sentence from the Pos TAG.
Original Sentence:Hi. How are you? This is Mike·
POSTag: Hi._NNP How_WRB are_VBP you?_JJ This_DT is_VBZ Mike._NN
找回原句我想是這樣的
String txt = "Hi._NNP How_WRB are_VBP you?_JJ This_DT is_VBZ Mike._NN";
String re1 = "((?:[a-z][a-z0-9_]*))"; // Variable Name 1
String re2 = ".*?"; // Non-greedy match on filler
String re3 = "(_)"; // Any Single Character 1
String re4 = "(NNP)"; // Word 1
Pattern p = Pattern.compile(re1 + re2 + re3 + re4, Pattern.CASE_INSENSITIVE | Pattern.DOTALL);
Matcher m = p.matcher(txt);
if (m.find()) {
String var1 = m.group(1);
System.out.print( var1.toString() );
}
}
輸出:嗨 但我需要一個列表中的所有名詞。
您是否嘗試過什麼了嗎? '[a-zA-Z](?= [。] _ NN)'將捕獲任何後跟'._NN'的alphachar-string,也許你可以從頭開始。 – sp00m
感謝您的回覆。 – srp
你的例子中有一個錯字。在第一個街區,「邁克。」之後是「_NN」,但在第二個塊中後面跟着「_NNP」。 –