到目前爲止,我已經評估了一些衆所周知的Java解析器,但其中沒有一個實際上可以以某種方式用於商業用途。就像OpenNLP一樣,它是免費的,但使用的培訓數據不可用於商業用途。 Morphadorner在那裏,但似乎最後在2009年更新。斯坦福NLP是完整的GPL,而LingPipe提供付費許可。完全免費的nlp解析器?
作爲一家非資助的創業公司,我真的不可能支付很高的許可費。我不得不爲我的需求實施基於規則的解析器,這與行業標準解決方案無法比擬。
雖然,我不是一個自由的怪物,它不像我需要的東西,只有少數人在世界上使用。我堅信,像NLP這樣的東西越來越受歡迎,再次實施POS Tagger就像是重新發明了一個重新發明的輪子。這是否真的沒有行業標準解決方案?
更新:思維定義似乎是行業標準意味着付費的東西。那麼如何來幾個HTML解析器庫(以及其他東西)免費。 Html解析器遠比NLP更有用,但仍然對NLP任務有相當大的要求。
更新:此問題已關閉。我很快就會很高興地發佈我的小型圖書館,用於利用Wordnet和各種漂亮規則進行關鍵詞提取。 感謝 AB
那麼「行業」標準是支付的東西:-) –
爲什麼負面投票?我說錯什麼了嗎?我爲我的需求實現了自己的解析器,但問題是,爲什麼到目前爲止還沒有完全免費的解析器? – akshayb
HTML解析比好的NLP複雜得多。 –