naivebayes

    0熱度

    2回答

    我正在使用我的數據來訓練Weka NaiveBayes分類器。我正在運行交叉驗證。當我運行它的5000分的情況下,它運行得很好,但是當我增加實例數100000,它就停在那兒顯示: 「訓練數據構建模型」 有沒有結果,weka在幾秒鐘後停止處理數據。

    0熱度

    1回答

    我用樸素貝葉斯與Apache星火MLlib文本分類如下教程:http://avulanov.blogspot.com/2014/08/text-classification-with-apache-spark.html /* instantiate Spark context (not needed for running inside Spark shell */ val sc = new S

    0熱度

    1回答

    我想分類一個ARFF文件,其中第一個15000實例設置了所有屬性,最後的1000個實例缺少最後一個屬性(屬性設置爲未知「?」)。 我想分類這些缺失的數據並導出它們,以便設置缺少的屬性(與輸入格式相同)。 我試圖使用Weka資源管理器,但我無法弄清楚如何管理我正在尋找的東西。 任何人都可以幫忙嗎?

    1熱度

    1回答

    我遇到過一個問題,使用樸素貝葉斯文檔分類到各種類的問題。 其實我很想知道P(C)或者我們掌握的類的先驗概率最初會隨着時間的推移而不斷變化。 例如,對於類 - [音樂,體育,新聞]初始概率是[1.25,1.25,0.50] 現在假設在某個月內的時間,如果我們有中 體育氾濫的相關文檔(例如80%運動),那麼我們的NaiveBayes將失敗,因爲它將基於先前的概率因素,其中只有25%是運動。 我們該如何

    2熱度

    1回答

    我正在使用TextBlob for python對推文進行一些情感分析。 TextBlob中的默認分析器是PatternAnalyzer,它運行良好,速度相當快。 sent = TextBlob(tweet.decode('utf-8')).sentiment 我現在已經嘗試切換到NaiveBayesAnalyzer,發現運行時是不切實際的我的需要。 (接近每鳴叫5秒。) sent = Tex

    -6熱度

    1回答

    假設我們有10000個文本文件,我們想分類爲政治,健康,天氣,體育,科學,教育......... 我需要培訓數據集用於文本文檔的分類,我是樸素貝葉斯分類算法。任何人都可以幫助獲取數據集。 或 是否有任何其他方法可以完成分類......我是機器學習新手請完整解釋您的答案。 實施例: **Sentence** **Output** 1)奧巴馬贏得大選。 -----------

    1熱度

    1回答

    我將以垃圾郵件分類爲例。規範的方法是對電子郵件的隨機抽樣進行手工分類,並使用它們來訓練NB分類器。 很好,現在說我添加了一堆我知道不是垃圾郵件的存檔電子郵件。這是否會影響我的分類結果,因爲現在垃圾郵件的比例:不是垃圾郵件不再具有代表性?我可以想到這兩種方式發生: 功能變得非垃圾郵件過重。 該算法在其分類隱式使用概率(垃圾)(以同樣的方式,概率(醫學狀況)由醫學病症的稀有性,即使測試是正面的貶值。

    1熱度

    1回答

    我正在開發一個Android的新聞應用程序,應該從網絡中提取特定新聞話題再作進一步的分類組的新聞報道中使用樸素貝葉斯分類類別樸素貝葉斯分類,任何身體知道如何實現它在Android或即使在Java?

    1熱度

    1回答

    我是機器學習的新手,我目前正試圖在Python 3.4中應用樸素貝葉斯分類器來實現ROC曲線。分類的實際代碼給出有: from __future__ import division from collections import defaultdict from math import log def train(samples): classes, freq = default

    -1熱度

    2回答

    我正在實現此代碼,這給了我輸出的電流,但我想保存這四行「數據集」在一個文件中,然後使用它。我這樣做?我如何使用我自己的文件而不是手動輸入數據集? from naiveBayesClassifier import tokenizer from naiveBayesClassifier.trainer import Trainer from naiveBayesClassifier.class