mallet

    2熱度

    1回答

    有沒有人有加載以前訓練過的模型的運氣?縱觀其API,CRFWriter類是拼圖的1/2,但CRFRead究竟如何(不存在類) 感謝您的幫助。

    4熱度

    3回答

    我使用MALLET了幾千行這是在輸出文本文件結果的話題分析(「topics.txt」)和一百多行,每一行由製表符分隔的變量是這樣的: Num1 text1 topic1 proportion1 topic2 proportion2 topic3 proportion3, etc. Num2 text2 topic1 proportion1 topic2 proportion2 topic3 pr

    2熱度

    1回答

    我使用Mallet的MaxEnt分類器進行文本分類。 Mallet提供了使用命令行提示報告準確性和F1分數的能力。 有沒有辦法使用命令行提示報告精度和召回分數?

    5熱度

    1回答

    有沒有人看過Mallet的GUI? 感謝

    0熱度

    1回答

    我是馬利特新手 我已經在我的電腦中安裝了馬利特。我已正確設置類路徑(我驗證它通過打印類路徑) 我想執行以下命令槌進口smvlight文件1 file2.mallet 每次我嘗試運行一個命令我得到一個錯誤說:「錯誤:無法找到或加載主類語言」 有人可以請幫我一樣嗎?我對此深感困擾。

    2熱度

    2回答

    我使用槌通過Java使用槌,我不能工作,如何評價一個我已經訓練現有的主題模型,新的文件。 我最初的代碼來生成我的模型是非常相似的是,在Mallett Developers Guide for Topic Modelling,之後,我只需保存模型作爲一個Java對象。在以後的過程中,我重新加載,從文件的Java對象,通過.addInstances()添加新的實例,然後想評估只針對原來的訓練集中找到主

    0熱度

    1回答

    我很難從Mallet開發人員列表中獲得幫助,所以我在此嘗試。 我有一個目標字母表{A,B,C}的InstancesList,我需要將目標字母表更改爲{A,NOT_A}。 到目前爲止,我有以下代碼(改編自其它馬利特的源代碼),但我 不斷收到: 字母不匹配:實例:5976,空],InstanceList:5976,2 ] ... InstanceList iListCopy = (InstanceL

    3熱度

    1回答

    訓練分類我有以下格式 產品名稱,一個產品的審查csv文件 現在用木槌我已經訓練分類,這樣,如果測試數據集作爲輸入其中包括產品評論,也應該告訴我哪個產品特定的審查屬於 槌的Java API幫助將不勝感激

    1熱度

    1回答

    我有一個文檔的語料庫,我已經標記過。我有大約400個標籤的固定列表 - 涉及不同的主題。每個文檔都標有一個或多個標籤,並且標題較短。 (我也有一個更大的標題列表 - 如果文檔包含非常相似的內容,我經常重複使用) 我想創建一個接口,爲新文檔建議標記/標題(來自我現有的列表)根據我如何標記現有文檔,我將其添加到語料庫中。 我已閱讀關於概率主題模型LDA類,它們在您沒有任何現有標記數據時對分析文本非常有

    2熱度

    1回答

    我想使用--use-ngrams true選項運行木槌,但似乎無法使其工作。 ./bin/mallet import-dir --input path --output topic-input.mallet --keep-seqence -- removed stopwords 現在,我要培養一種外用NGRAM型號:我採用進口我的數據 bin/mallet train-topics --inp