0
A
回答
3
1
爲了完成你正在做的事情,你需要使用詞性標註器來分類句子中使用的詞類。 您可以使用任何一種自然語言處理庫來做到這一點。 例如。在Python中你有pynltk。 http://answers.oreilly.com/topic/1091-how-to-use-an-nltk-part-of-speech-tagger/
之後,您需要根據詞性對詞彙進行分組並統計它們。 完全超出了正則表達式的範圍。
0
你的正則表達式是(\\s|^)([a-zA-Z]+?)<Noun>(\\s|$)
,在每一個找到的匹配,你應該使用$2
通過使用下面的代碼來獲得結果
在C#中,你可以做到這一點:
string type = "Noun";
int top = 5;
MatchCollection mc = Regex.Matches("I<Noun> like<verb> to<Function> eat<verb> an apple<Noun>", String.Format("(\\s|^)([a-zA-Z]+?)<{0}>(\\s|$)", type));
List<string> res = new List<string>();
for (int i = 0; i < mc.Count && i < top; i++)
{
res.Add(mc[i].Result("$2"));
}
相關問題
- 1. 正則表達式來匹配單詞
- 2. 正則表達式前面的單詞匹配
- 3. 用於匹配單詞或單詞的正則表達式
- 4. 正則表達式:匹配所有包含單詞的單詞
- 5. pcre正則表達式匹配前兩個單詞,數字
- 6. PHP的正則表達式匹配詞
- 7. 正則表達式匹配後的詞
- 8. 正則表達式第n個匹配
- 9. java的正則表達式 - 匹配一個OCCURENCES僅
- 10. python正則表達式來匹配有n個詞的句子
- 11. 使用正則表達式匹配部分單詞或單詞
- 12. 正則表達式 - 匹配一組詞
- 13. C++正則表達式匹配「+」量詞
- 14. 正則表達式匹配兩個詞
- 15. 正則表達式匹配單行或多行的任何單詞[\ r \ n]
- 16. 正則表達式匹配字符串的前n個字符
- 17. 正則表達式匹配短語中的單個單詞
- 18. 正則表達式匹配前綴
- 19. 正則表達式匹配URL前綴
- 20. 用正則表達式匹配至少包含n個單詞的句子
- 21. 正則表達式匹配N跟短語前導空格
- 22. 正則表達式匹配單詞組和以前匹配的單詞組的部分
- 23. 簡單的正則表達式匹配
- 24. 簡單的正則表達式匹配
- 25. 簡單匹配的正則表達式
- 26. 簡單的正則表達式匹配
- 27. 簡單的正則表達式匹配
- 28. 用於匹配句子中的單詞的正則表達式
- 29. 正則表達式匹配完整的單詞,從第(JavaScript)的
- 30. 正則表達式匹配,如果詞不前,其他字
如何正則表達式應該知道一個詞是一個名詞?有時候,這對人類來說並不明顯。 –
好吧,你想列出專有名詞? –
你甚至不知道語言是什麼 – fge