2012-07-08 27 views
2

我通過一個關於文本簡化的項目,有幾個開放源代碼提供諸如斯坦福分析器等文本解析器。想知道是否有任何解析器能夠使用機器學習來解析文本!使用機器學習的文本簡化

+1

你想要做什麼樣的簡化?你使用了什麼樣的複雜度量度? – dmh 2012-07-09 16:37:04

+0

我正在嘗試使用'ML'進行語法簡化。複雜性的度量是分析複雜性。我得到了包含用戶需求的文檔,我需要將文本更改爲句子,因此這些句子可以表示故事卡,因爲它在「極限編程」Agel方法論 – 2012-07-10 01:56:59

+0

您能否給我們提供一個具體的輸入示例和期望的輸出? 「分析複雜性」對我來說似乎也不是很明確。確定文本的難度是一項不平凡的任務;你有什麼樣的用戶需求? – dmh 2012-07-10 19:25:40

回答

1

OpenNLP是一個很好的開源庫。您可以使用許多特定的機器學習算法(如MaxEnt)來訓練此庫以生成特定於您的需求的模型。你也可以看到這個discussion

雖然OpenNLP具有Apache許可證,但還有另一種名爲LingPipe的工具,它也提供了類似的功能但許可證不同。

Mahout也是一個很好的機器學習庫,但是,您需要使用其他解析器或您自己的實現從文本中提取特徵。 Mahout需要學習功能。

教程: 1. OpenNLP Tutorials 2. LingPipe Tutorials

+0

坦克vikas,你會分享任何文件或教程,顯示這些開源如何plz! – 2012-07-08 08:45:25

+0

這些都是非常受歡迎的項目,所以找到教程不應該是一個大任務。我仍然添加了一些鏈接到我的答案。另外還增加了一個機器學習庫。希望這可以幫助。 – vikas 2012-07-08 11:56:35

+0

OpenNLP從SourceForge移動到Apache。請參考一個更新的文檔:http://opennlp.apache.org/documentation.html – wcolen 2012-07-10 12:01:41