mallet

    2熱度

    1回答

    中每個主題的詞語分佈p(w | t)我需要獲得以Java編程的Mallet找到的每個主題的單詞分佈(不在CLI中,如how to get a probability distribution for a topic in mallet?中所述)。對於我的意思的例子:Introduction to Latent Dirichlet Allocation: Topic A: 30% broccoli,

    0熱度

    1回答

    當我們訓練CRF Mallet時,什麼是模型文件? java -cp「/home/hough/mallet/class:/home/hough/mallet/lib/mallet-deps.jar」cc.mallet.fst.SimpleTagger --train true --model-file nouncrf示例

    0熱度

    1回答

    我下載並安裝了最新版本的Mallet。我的成功建立,但是當我嘗試運行SimpleTagger: java命令槌deps.jar cc.mallet.fst.SimpleTagger --train真正--model文件nouncrf樣品 或 java命令 「/mallet/class:/lib/mallet-deps.jar」 cc.mallet.fst.SimpleTagger --train真

    1熱度

    1回答

    分類器經常因OutOfMemoryError失敗。請建議。 我們有UIMA管道,每個管道調用5個大約30MB的模型罐(基於槌CRF)。 -Xms設置爲2G,-Xmx設置爲4G。 設置堆空間時是否有任何指導/基準標記? 請指出是否有關於多線程環境的任何指導。 我確實嘗試了應用補丁https://code.google.com/p/cleartk/issues/detail?id=408,但這並未解決

    1熱度

    1回答

    我從指定20個主題的文本體訓練了一個模型,但是當我在新文檔上運行推理器時,它僅輸出10個主題權重。這是我使用的命令: 斌/槌導入文件--input /data/research/bazaarvoice/data/review_nouns.txt --output /data/research/bazaarvoice/data/review_nouns_mallet.mallet --keep序列-

    0熱度

    1回答

    當前我正在處理一個項目,並且正在使用來自MALLET API的CsvIterator創建一個InstanceList。但是,我不確定MALLET實例對象中的數據字段應該如何格式化。我試圖將從一行文本解析的數據寫入文件。 我知道數據字段通常是InstanceList中的FeatureVector對象,但我只是不確定CsvIterator在尋找什麼。 謝謝。

    0熱度

    1回答

    我想測試與槌內置了文本分類的準確度,有4種特徵選擇方法可用。(FeatureCounts,InfoGain,ExpGain和GradientGain )。 我想知道如何使用ExpGain和GradientGain。例如: 例如: FeatureSelector fselector = new FeatureSelector (new FeatureCounts.Factory(),numOfFea

    1熱度

    1回答

    我希望在保存爲用於Mallet模型的InputDirectory中的單個文件的語料庫上應用使用porter算法的詞根分析。有人可以幫助它如何執行?

    1熱度

    1回答

    我正在嘗試使用Java的Mallet API。但是,我無法導入任何內容。 將外部jar添加到eclipse中的classpath中似乎沒有任何作用。將mallet.jar和mallet-deps.jar複製到一個lib文件並添加內部jar也失敗了。 Mallet已經正確安裝,並且可以從命令行運行而沒有問題。 當我嘗試 import cc.mallet.types.*; 和Eclipse說,發生

    2熱度

    1回答

    我嘗試使用Java中的Mallet實現文檔分類器。我已經有一個基本包含特徵值的文件。所以我不想貫穿整個raw text處理流水線。 在我的特徵文件中的一行看起來像這樣的時刻(2個功能,ID和NrOfToken,文件標記爲「A」) ID=3 NrofTokens=279.0 A 我嘗試在這個文件中讀取並把它到這樣的分類: Pipe instancePipe = new SerialPipes(new