mallet

    0熱度

    3回答

    我用下面的命令來生成一些文件主題模型: bin/mallet train-topics --input topic-input.mallet --num-topics 100 --output-state topic-state.gz 我沒有,但是,使用--output-model選項生成一個序列化主題教練對象。有什麼辦法可以使用狀態文件來推斷新文檔的主題嗎?培訓很慢,如果我必須從頭開始創建序

    2熱度

    2回答

    我是新來的NLP主題,並要求使用Mallet執行命名實體識別(NER)。 我有一個文本,我給它的每個單詞的特徵向量。我想培訓一個模型,稍後我可以在新的文本文件上進行測試。 我的問題是如何創建這樣的模型,模型的輸入是什麼。我可以使用一些代碼示例:) 謝謝!

    4熱度

    1回答

    我現在正在用Mallet關於HMM的荒謬文檔很差的努力掙扎。我設法將數據導入實例(從ImportExample.java片段調整),我只是想知道如何使用它們來訓練HMM模型。 我首先創建一個HMM實例開始,但我不知道是否去: HMM hmm = new HMM(instances.getDataAlphabet(), instances.getTargetAlphabet()); 或者使用相同

    6熱度

    5回答

    我一直在使用木槌推斷包含100,000行(大約34 MB木槌格式)的文本文件的主題。但是現在我需要在包含一百萬行(大約180MB)的文件上運行它,並且得到一個java.lang.outofmemory異常。有沒有辦法將文件分割成更小的文件,併爲所有文件中的數據組合起來構建模型? 由於事先

    28熱度

    3回答

    我剛剛閱讀了一篇關於如何將MALLET用於主題建模的迷人文章,但是我找不到任何在線比較MALLET與NLTK的任何內容,而我已經有了一些經驗。 它們之間的主要區別是什麼? MALLET是一個更「完整」的資源嗎(例如,有更多的工具和算法)?或者回答這些前兩個問題的一些好的文章在哪裏?

    2熱度

    1回答

    我正在使用CRF開發Mallet上的NER系統。 你知道是否有可能爲每個預測收集特徵貢獻? 我需要知道並理解CRF模型的精確行爲。 有什麼建議嗎? 謝謝。 乾杯, ukrania

    3熱度

    3回答

    您好,我必須使用Mallet Java API進行主題建模,但是我對編碼很陌生,所以我發現很難理解Java庫並使用它們。有沒有人有一些示例代碼,他們使用可用於構建的API進行主題建模?

    2熱度

    1回答

    您好,我必須使用Mallet Java API進行主題建模,但是我對Mallet很陌生,所以我發現很難理解Mallet庫並使用它們。有沒有人知道任何地方可能有一些主題建模的源代碼來理解這些庫?

    2熱度

    1回答

    我正在使用maxent算法來進行標籤分類。我想知道是否有可能爲maxent分類器預測的標籤獲得某種置信度值。我基本需要的是對分類器最有信心的最重要的K預測(不是針對每個令牌,而是來自整個數據)實例,並將其用於自舉。有沒有辦法做到這一點?

    5熱度

    2回答

    任何使用Java庫的Mallet的SimpleTagger類用於條件隨機字段(CRF)的問題。假設我已經使用多線程選項來獲得可用CPU的最大數量(這種情況):我會在哪裏開始,如果我需要它運行得更快,我應該嘗試一些什麼? 一個相關的問題是,是否有辦法做類似於隨機梯度下降,這將加快培訓過程? 我想要做培訓的類型很簡單: Input: Feature1 ... FeatureN SequenceLab