mallet

    0熱度

    1回答

    對於我目前的項目,我必須建立一個主題建模或分類實用程序,它將處理數以千計的文章,將它們分類爲各種主題(主題可能是40-50從開始)。對於例如它會瀏覽數據庫技術文章,並將它們分類爲文章是否爲NOSQL文章/關係數據庫文章/圖數據庫文章(僅舉例)。 我有非常基本的NLP背景,我們的團隊主要有python後端腳本經驗。我開始研究可用於實現它的各種選項,並且遇到了基於Python的NLTK和Scikit-

    3熱度

    2回答

    我已經使用木槌製作了一個並行主題模型。 而且我想爲每個文檔獲得最好的單詞。 要做到這一點,我試圖得到一個話題話題概率矩陣。 我該怎麼做到這一點?

    0熱度

    1回答

    請,我想在槌子運行類Simple Tagger。我使用eclipse工作。我只需要知道輸入參數的順序。 這link解釋每個參數,但不是爲了(參數[0],ARGS 1等) 此外,你有關於這個類的運行時間,請的想法?

    6熱度

    1回答

    我正在尋找有人詳細寫/知道MALLET類。我知道這是ML問題的一個很好的工具,現在我嘗試實現這裏描述的基於CRF的距離算法Andrew McCallum, Kedar Bellare and Fernando Pereira。 作者告訴他們,他們已經意識到所提出的模型爲Mallet FST類。可悲的是,java並不是我熟知的Ruby語言,這就是爲什麼我有一些問題來理解如何使用他們的模型,例如哪些類

    0熱度

    3回答

    當我運行命令 bin \ mallet train-topics --input input.tutorial.mallet --num-topics 40 --num-iterations 100 --optimize -interval 50 --optimize-burn-in 200 --output-state input.gz --output-topic-keys inputkeys

    12熱度

    4回答

    我試圖在Java中運行Mallet,並且出現以下錯誤。 Couldn't open cc.mallet.util.MalletLogger resources/logging.properties file. Perhaps the 'resources' directories weren't copied into the 'class' directory. Continuing.

    1熱度

    1回答

    我正在查看木槌源代碼,並且似乎大多數分類器實現(例如樸素貝葉斯)並沒有真正考慮到特徵選擇,即使InstanceList類有一個setFeatureSelection方法。 現在我想用我的數據集進行一些快速實驗,包括特徵選擇。我想,從技術捷徑的角度來看,我可能會得到最低排名的功能,並將這些值設置爲0。機器學習中的特徵選擇是否相當於分類器訓練中的特徵選擇,從而根本不考慮它們(如果不涉及平滑,例如拉普拉

    1熱度

    1回答

    我正在用槌做主題建模。我已經導入我的文件(每個文檔在一行),我訓練了200個話題的槌。現在我有200個話題與他們的話相關對於每個topic.Now我需要知道每個主題的概率。我怎麼知道? 謝謝

    1熱度

    1回答

    我正在使用Mallet的GenericAcrfTui來訓練和測試數據。所以我使用Mallet中的圖形模型(GRMM)進行CRF培訓。我爲我的訓練集和測試集創建了特性,並希望從命令行運行GenericAcrfTui。當我運行它時,我得到了每個標籤的F分數和準確性度量,但我沒有回到每行的實際標籤。我做這樣的事情: java -cp $GRMM/class:$GRMM/lib/mallet-deps.j

    0熱度

    1回答

    我將使用Mallet SimpleTagger進行序列標記。但是,我在設置類路徑時遇到了問題。正如我在這裏看到的:classpath 我必須能夠使用java -cp來設置類路徑。 我按照說明here(我相信我已經正確安裝了Ant和Mallet)。不過,我收到此消息: Error: could not find or load main class cc.mallet.fst.SimpleTagge