opennlp

    0熱度

    1回答

    我使用OpenNLP 1.5.2與CDH 4並有一個不尋常的問題。 當我運行我的jUnit測試時,一切都通過了。 當我以localJobRunner模式運行(psuedo或full模式)時,許多名稱並不總是被識別出來,並且當我期待某些事情時,我有'空白'跨度返回。 是的,在本地/ psuedo /完整模式下找不到的名稱在我的jUnit測試中! 每次撥打電話時,我都會一次輸入一個句子。我將這個句子轉

    16熱度

    3回答

    我的工作是計劃使用UIMA集羣來運行文檔以提取命名實體,而不是。據我所知,UIMA幾乎沒有與它一起打包的NLP組件。我一直在測試GATE一段時間,並且對它很滿意。它在正常文本上沒問題,但是當我們通過一些有代表性的測試數據運行它時,精度會下降。我們內部的文本數據有時全部大寫,有時全部小寫,或者在同一文檔中混合使用。即使使用ANNIE的所有上限規則,準確性仍有很多不足之處。我最近聽說過斯坦福大學的NL

    2熱度

    1回答

    是否有任何有關OpenNLP中解析器標籤的含義的文檔?我知道POS標籤類型遵循TreeBank約定,但不幸的是我還沒有找到關於解析器標籤的任何信息,例如「SBAR」等。 此文檔是否存在某處或我必須弄清楚我?

    4熱度

    1回答

    我想從句子中提取從屬子句,主要子句,關係子句,限制性關係子句,非限制性關係子句,但我不知道如何完成這項工作。例如: 「我第一次在巴黎見過她,我住在九十年代初。」 [主要條款] [親屬條款] 「她伸出受傷的手。 [主條款] [限制性關係條款] 請幫我做這個工作嗎?

    18熱度

    3回答

    我想計算兩個任意句子相互之間的相似程度。例如: 數學家找到了解決該問題。 這個問題是由一位年輕的數學家解決的。 我可以用一個標籤,一詞幹和解析器,但我不知道如何檢測這些句子都差不多。

    2熱度

    1回答

    我是OpenNLP中的新成員。我使用OpenNLP從句子中查找位置的名稱。我的輸入字符串是「意大利在CIA情況下赦免美國上校」。結果集中找不到「意大利」字樣。我怎麼解決這個問題。提前致謝! try { InputStream modelIn = new FileInputStream("en-token.bin"); TokenizerModel tokenModel = ne

    0熱度

    1回答

    我想從GitHub獲取以下代碼片段,以便我可以在Groovy腳本中使用OpenNLP工具。 (從https://gist.github.com/nagaimasato/1178725 OpenNLP類) #!/usr/bin/env groovy @Grapes( @Grab( group='org.apache.opennlp', module='opennlp-

    1熱度

    2回答

    我有一個解析樹,它是opennlp中類Parse類的對象。我想打印分析樹中的文本。例如,請考慮以下語句:Wikipedia is a collaboratively edited, multilingual, free Internet encyclopedia supported by the non-profit Wikimedia Foundation.。我已經確定了名詞短語在句子: (NP

    0熱度

    1回答

    任何人都可以告訴我如何爲分類創建培訓數據。我正在使用OpenNLP進行分類。是否有任何工具來創建培訓數據,或者如果我必須手動創建它,那麼應該如何完成?我在這個領域是一個完整的noob。請幫忙

    1熱度

    1回答

    我剛開始使用NLP(自然語言處理)並努力理解一個重要的概念。如何訓練未來投入關係提取系統? 例如,我有幾行這樣的: 湯姆正在爲ABC公司 傑裏工作在XYZ 組織是哪裏人工作的地方。 在所有這些情況下,相對於船是「人」,「組織」有關係船型「工作」 基於上面的例子中,有些NLP的讀數,我認爲我們需要基於部分訓練系統語音標籤比真實的「實體名稱」更爲通用,可以用於其他領域的輸入數據。這是我非常困惑的部分。