opennlp

    0熱度

    2回答

    我工作(R與openNLP)從提供的語句中提取數字數據。 的語句是"The room temperature is 37 to 39 C. The Air flow is near 80 cfm". 這裏的預期輸出"Temperature > 37 - 39c","Air flow -> 80cfm"。 你可以建議POS標籤上的任何正則表達式模式來獲得名詞(NN)和下一個可用的數字數據(CD)嗎?

    0熱度

    1回答

    我想創建一個交互式markdown文件使用閃亮,我面臨與使用ggplot與使用rJava的庫的問題。使用rJava似乎不會造成問題。 我不得不使用openNLP因爲我想要做一些文字採礦和它造成的文件,當我使用的渲染一個renderPlot情節ggplot(完全無關的使用openNLP)正是第二次崩潰。 我後來注意到這種情況發生在我剛導入任何使用rJava的庫時。 一些圖書館我嘗試,得到了相同的反應

    2熱度

    3回答

    我目前正在開發一個項目,我正在接收電子郵件,使用電子郵件包剝離郵件正文,然後我想用體育,政治,技術等標籤對它們進行分類。等等...我已經成功地從我的電子郵件中刪除了郵件正文。我期待着開始分類。 爲了製作多個標籤,如運動,科技,政治,娛樂等,我需要每個標籤的一組詞語來製作標籤。舉例 體育標籤將標籤數據:足球,足球,曲棍球...... 我在哪裏可以找到網上的標籤數據,以幫助我嗎?

    1熱度

    1回答

    我想訓練一個模型中使用opennlp分類鳴叫。我的問題是我應該在用於訓練模型的tweets上執行標記化,停止單詞刪除等操作,還是應該直接使用tweet而不執行消毒處理?

    0熱度

    3回答

    我正在開發OpenNLP項目並遇到一些諸如特徵生成等內容。 「功能」一詞到底意味着什麼?如果你可以用laymans術語解釋它,那將是非常好的

    1熱度

    2回答

    我已經嘗試過許多NER工具(OpenNLP,Stanford NER,LingPipe,Dbpedia Spotlight等)。 但是,經常回避我的是一個基於地名詞典/字典的NER系統,其中我的自由文本與預先定義的實體名稱列表相匹配,並且可能的匹配被返回。 這樣我可以有各種像PERSON,ORGANIZATION等列表我可以動態更改列表並獲得不同的提取。這將大大減少培訓時間(因爲其中大部分都基於m

    0熱度

    1回答

    我試圖使用最大熵分類器的OpenNLP實現,但它似乎文檔是相當缺乏,儘管這個庫顯然設計爲易於使用我無法找到一個單一的例子和/或規範的輸入文件格式(即訓練集)。 任何人都知道在哪裏可以找到這個或一個最小的培訓示例?

    1熱度

    1回答

    我在我的項目中探索Apache OpenNLP產品,其中一個要求是在我的案例中堅持訓練有素的DB - Mongo DB/couchbase模型。 現在主要是我期待的文檔分類模型輸出存儲數據庫,這樣我就不必重新運行,除非它修改 我看到庫中的類不能序列例如DocumentCategorizerME和我得到json deserilization異常,如果我試圖檢索持久性記錄,所以想知道是否有人已經這樣做

    1熱度

    2回答

    我在解決方案中有兩個單獨的項目。 第一個項目是隻是一個測試控制檯項目。 而第二個項目是公共庫項目。 我有靜態類Common Lib包含需要讀取文件(用於OpenNLP)的靜態方法的項目。 var sentenceDetector = new EnglishMaximumEntropySentenceDetector("EnglishSD.nbin"); 我添加文件 「EnglishSD.nbi

    0熱度

    1回答

    我曾經使用斯坦福CoreNLP,我想這次調查OpenNLP。 是否可以創建自己的Annotator?例如,我想分析一個文本並僅挑選顏色或飛機名稱。 斯坦福NER讓我創建自己的NER模型來做到這一點。 任何建議? 謝謝