2013-05-27 126 views
0

到目前爲止,我已經評估了一些衆所周知的Java解析器,但其中沒有一個實際上可以以某種方式用於商業用途。就像OpenNLP一樣,它是免費的,但使用的培訓數據不可用於商業用途。 Morphadorner在那裏,但似乎最後在2009年更新。斯坦福NLP是完整的GPL,而LingPipe提供付費許可。完全免費的nlp解析器?

作爲一家非資助的創業公司,我真的不可能支付很高的許可費。我不得不爲我的需求實施基於規則的解析器,這與行業標準解決方案無法比擬。

雖然,我不是一個自由的怪物,它不像我需要的東西,只有少數人在世界上使用。我堅信,像NLP這樣的東西越來越受歡迎,再次實施POS Tagger就像是重新發明了一個重新發明的輪子。這是否真的沒有行業標準解決方案?

更新:思維定義似乎是行業標準意味着付費的東西。那麼如何來幾個HTML解析器庫(以及其他東西)免費。 Html解析器遠比NLP更有用,但仍然對NLP任務有相當大的要求。

更新:此問題已關閉。我很快就會很高興地發佈我的小型圖書館,用於利用Wordnet和各種漂亮規則進行關鍵詞提取。 感謝 AB

+2

那麼「行業」標準是支付的東西:-) –

+1

爲什麼負面投票?我說錯什麼了嗎?我爲我的需求實現了自己的解析器,但問題是,爲什麼到目前爲止還沒有完全免費的解析器? – akshayb

+0

HTML解析比好的NLP複雜得多。 –

回答

4

您已經確定瞭解決方案:

斯坦福NLP是全GPL ...

有使用GPL的商業項目沒有禁令。

問題是,如果您以二進制形式分發代碼,則還必須提供源代碼。這意味着您的商業模式需要基於向客戶提供付費支持和/或服務(而不是銷售軟件許可證)......但是有許多公司基於類似模式賺取了高額利潤。


下面是關於這個話題的一些其他潛在客戶其他Nexus Q &答:


的心態似乎是行業標準意味着支付的事情。那麼如何來幾個HTML解析器庫(以及其他東西)免費。 Html解析器遠比NLP更有用,但仍然對NLP任務有相當大的要求。

由團隊(或組織或公司)開發類似的東西來決定他們如何執照。看起來,現有的NLP產品都沒有「像啤酒一樣自由」。這是他們的選擇。而且你沒有權利投訴......因爲你也選擇不讓你的應用程序可用於「免費的啤酒」。

正如我所指出的,斯坦福大學的NLP是「自由自由」。只是你不準備承擔GPL的義務。

沒有人欠你有責任爲你做免費的事情。作爲潛在的企業家,你不應該期待它。 (FWIW,之所以有免費的啤酒HTML解析器,以及許多其他的事情,通常是問題比NLP容易得多,或者有公司/組織在那裏誰有捐贈很多資源,以獲得代碼開發。)

+0

謝謝。我很喜歡,但句子解析只是我的應用程序的一部分。我不贊成目前發佈完整代碼的想法。 – akshayb

+0

這是您的選擇。但是如果你做出了這個選擇,你可能會發現你必須預先付出沉重的現金。 –

+0

不要忘記GPL中的ASP漏洞(包括v2)。您可以在您的網站上使用GPL v2軟件,但不能發佈源代碼。 http://www.funambol.com/blog/capo/2006/08/honest-public-license.html –