2011-03-12 91 views
7

有人可以推薦韓國,印度尼西亞,泰國和越南的開源POS tagger嗎?韓國,泰國和印度尼西亞POS tagger

我可以用它來標記我目前擁有的語料庫數據。 (例如the stanford-postagger

如果你是一名開發人員並且非常關心共享並讓我測試POS標記器,我也不介意。

隨着輸出的一些修改,我POS標記越南數據和jvntextpro

但我還是想對韓國更多的投入,印尼和泰國的詞性標註。

回答

5

ACL維基後:Korean morphological analyzer and part-of-speech tagger

我將開始把眼光放在NLP研究部門在韓國,泰國和韓國的網站。 On this page,你會找到研究部門的鏈接。

祝你好運!

更新:OpenNLP有泰國的PoS。以下是適用於PoS opennlp tagger的型號:http://opennlp.sourceforge.net/models/thai/

+0

http://isoft.postech.ac.kr/Course/CS730b/2005/index.html我在這個頁面上找到了韓文標記器。現在泰國tagger失蹤了。哈哈..感謝頁面,但我們需要一個更好的整理NLP資源。 – alvas 2011-04-16 04:49:36

0

您可能想嘗試RDRPOSTagger:一種強大的,易於使用且與語言無關的POS和形態標記工具包。

(編程語言:Python的& JAVA)

RDRPOSTagger獲得學習能力和標記過程快速的性能。另外,與最新的結果相比,RDRPOSTagger實現了非常具有競爭力的準確性。在this paper中查看實驗結果,包括性能速度和標記精度。

RDRPOSTagger現在支持13種語言(包括泰語和越南語)的預訓練POS和形態標註模型。