有人可以推薦韓國,印度尼西亞,泰國和越南的開源POS tagger嗎?韓國,泰國和印度尼西亞POS tagger
我可以用它來標記我目前擁有的語料庫數據。 (例如the stanford-postagger)
如果你是一名開發人員並且非常關心共享並讓我測試POS標記器,我也不介意。
隨着輸出的一些修改,我POS標記越南數據和jvntextpro
但我還是想對韓國更多的投入,印尼和泰國的詞性標註。
有人可以推薦韓國,印度尼西亞,泰國和越南的開源POS tagger嗎?韓國,泰國和印度尼西亞POS tagger
我可以用它來標記我目前擁有的語料庫數據。 (例如the stanford-postagger)
如果你是一名開發人員並且非常關心共享並讓我測試POS標記器,我也不介意。
隨着輸出的一些修改,我POS標記越南數據和jvntextpro
但我還是想對韓國更多的投入,印尼和泰國的詞性標註。
ACL維基後:Korean morphological analyzer and part-of-speech tagger
我將開始把眼光放在NLP研究部門在韓國,泰國和韓國的網站。 On this page,你會找到研究部門的鏈接。
祝你好運!
更新:OpenNLP有泰國的PoS。以下是適用於PoS opennlp tagger的型號:http://opennlp.sourceforge.net/models/thai/。
您可能想嘗試RDRPOSTagger:一種強大的,易於使用且與語言無關的POS和形態標記工具包。
(編程語言:Python的& JAVA)
RDRPOSTagger獲得學習能力和標記過程快速的性能。另外,與最新的結果相比,RDRPOSTagger實現了非常具有競爭力的準確性。在this paper中查看實驗結果,包括性能速度和標記精度。
RDRPOSTagger現在支持13種語言(包括泰語和越南語)的預訓練POS和形態標註模型。
http://isoft.postech.ac.kr/Course/CS730b/2005/index.html我在這個頁面上找到了韓文標記器。現在泰國tagger失蹤了。哈哈..感謝頁面,但我們需要一個更好的整理NLP資源。 – alvas 2011-04-16 04:49:36