mallet

    1熱度

    1回答

    我正在嘗試在項目中使用MALLET機器學習庫來進行詞義消歧。我的特徵向量包含一個x令牌的固定大小的令牌窗口,位於目標令牌的左側和右側。槌訓練實例被創建這樣的: // Create training list Pipe pipe = new TokenSequenceLowercase(); InstanceList instanceList = new InstanceList(pipe);

    0熱度

    1回答

    我嘗試使用運行MALLET主題建模通過以下命令行: bin/mallet import-dir --input data\my_text \ --output my.mallet \ --remove-stopwords TRUE \ --keep-sequence TRUE \ --gram-sizes 1,2 \ --kee

    0熱度

    2回答

    我正在嘗試使用Java API進行主題建模。這個包提供了一個方便的例子。但是,考慮到我的數據的規模要大得多,我認爲從一個文件導入它是不切實際的。 我查看了鏈接到另一個MALLET問題的PowerPoint演示文稿,發現了一個名爲FileIterator的東西,我相信我應該可以使用它們代替示例Java代碼中使用的CsvIterator。但是,我不確定我是否正確使用它。我試着用它運行我的代碼,並且它在

    1熱度

    1回答

    我已經將木槌文件導入,現在我想從導入的數據建模主題並將它們存儲在文本文件中,從那裏我將能夠讀取這些主題。任何人都可以幫助編寫主題提取命令,因爲我在下面輸入了主題提取命令,但它會引發異常。 倉\槌進口-DIR --input d:\數據\ TEST1 --output test1.mallet --keep序列--remove-停用詞--extra-停用詞通過去除extra.txt - -keep-

    4熱度

    2回答

    我正在使用槌子主題建模示例代碼,雖然它運行良好,我想知道這個聲明的參數實際上是什麼意思? instances.addThruPipe(new CsvIterator(new FileReader(dataFile), "(\\w+)\\s+(\\w+)\\s+(.*)", 3, 2, 1) // (data, target, name) fi

    1熱度

    1回答

    我計算LDA的模型的估計與槌在Java中,我期待爲長期話題矩陣。 計算模型,並獲得主題的文檔矩陣得好: ParallelTopicModel model = ...; //... estimating the model int numTopics = model.getNumTopics(); int numDocs = model.getData().size(); // Getti

    0熱度

    1回答

    感謝您閱讀並花時間考慮並回應此問題。 我正在使用Gensim的Mallet包裝(ldamallet.py),它的作用就像魅力。我需要爲我的語料庫(在我的所有文檔中)獲得主題比例,我不知道該怎麼做。 model.alpha不是它,因爲它沒有被歸一化爲1.另外,alpha包含我的Dirichlet參數,而不是主題比例。我對麼? 任何幫助,非常感謝。

    1熱度

    1回答

    當我運行具有較多主題(例如T> 300)的Mallet LDA時,我會獲得帶有空主題詞(沒有單個主題詞)的主題。 這是爲什麼發生?這是Mallet中的一個錯誤嗎? 我在ubuntu 14.04機器上使用了mallet 2.0.7。 編輯 mallet-2.0.7/bin/mallet import-dir --input $path/$posts --output $outputDir/$post

    1熱度

    1回答

    我在學習木槌,我正在嘗試這個例子。所以,我跑這個命令 斌/槌進口DIR --input抽樣數據/網絡/ * --output web.mallet 從鏈接http://mallet.cs.umass.edu/import.php 我得到的輸出是文件名爲web.mallet,但不是可讀格式。它是web.mallet:Java序列化數據,版本5。如何轉換成可以讀取的特徵向量或者轉換成csv文件或文本文

    1熱度

    1回答

    我在R中使用木槌,直到我安裝devtools時它工作正常。之後,我開始得到以下我從來沒有得到的錯誤。 Error in .jcall("RJavaTools", "Ljava/lang/Object;", "invokeMethod", cl, : java.lang.NoSuchMethodException: No suitable method for the given para