bayesian

    0熱度

    2回答

    這是從stats.stackexchange轉發,我沒有得到滿意的答覆。我有兩個數據集,第一個在學校,第二個列出每個學校誰在標準化測試(強調故意)失敗的學生。假數據集可以通過(感謝Tharen)產生: #random school data for 30 schools schools.num = 30 schools.data = data.frame(school_id=seq(1,sch

    4熱度

    1回答

    我試圖用OpenBUGS通過R(R2OpenBUGS)將觀察「時間」建模爲隨機變量。如果所有的觀測時間都可用(沒有NA),一切都可以正常工作,但如果我將其中一個時間設置爲NA,則什麼都不會發生。我用WinBUGS測試了相同的代碼,並得到陷阱錯誤'NIL dereference(read)'。所以我的問題是,在我的代碼中是否存在真正的錯誤,或者我的模型對於BUGS太奇怪了? 我的模式是這樣的: mo

    2熱度

    1回答

    我沒有使用10倍交叉驗證樸素貝葉斯分類,上看起來像這樣的測試數據,獲得表預測: === Predictions on test data === inst# actual predicted error prediction (name) 1 3:no_chang 3:no_chang 0.943 (region_1) 2 1:active_K 1:act

    4熱度

    1回答

    我試圖使用MCS(多分類系統)做一些更好的工作,有限的數據即變得更加準確。 我現在正在使用K-means聚類,但可能選擇使用FCM(模糊C均值),數據聚集成組(聚類),數據可能代表任何東西,例如顏色。我首先將數據在預處理和規範化之後進行聚類,然後得到一些間隔很多的不同簇。然後,我繼續使用這些聚類作爲貝葉斯分類器的數據,每個聚類代表一種不同的顏色,並且訓練貝葉斯分類器,然後將來自聚類的數據通過單獨的

    3熱度

    3回答

    我使用scikit-learn來查找文檔的Tf-idf權重,然後使用樸素貝葉斯分類器對文本進行分類。但文件中所有單詞的Tf-idf權重除少數外均爲負數。但據我所知,負值意味着不重要的條款。那麼是否有必要將整個Tf-idf值傳遞給貝葉斯分類器?如果我們只需要通過其中幾個,我們該怎麼做?與linearSVC相比,貝葉斯分類器有多好還是壞?有沒有更好的方式來找到除了使用Tf-idf以外的文本中的標籤?

    1熱度

    1回答

    我正在使用apache mahout在客戶支持域中執行情感分析。由於我無法獲得適當的訓練數據集,因此我創建了自己的訓練數據集。現在我有100封支持正面信息的郵件和100封負面郵件。 但問題是,我無法達到準確性。它停留在55%左右,這是可悲的。大約70%左右的精確度將令人滿意。另外請注意,我使用的是apache mahout的免費樸素貝葉斯分類器。 剛纔提到的問題是,減小數據集大小是否會降低準確度?

    1熱度

    1回答

    我的第一篇文章在這裏! 我有使用nltk NaiveBayesClassifier的問題。我有一套7000件的訓練。每個培訓項目都有2或3個世界和代碼的描述。我想使用代碼作爲類的標籤和描述的每個世界作爲特徵。 一個例子: 「我的名字是奧巴馬」,001 ... 訓練集= {[功能[ '我的'] = TRUE,功能[ '名'] = TRUE,功能[」是'] =真,功能[奧巴馬] =真],001} 不幸

    1熱度

    1回答

    你好我使用的KDD 1999數據集,我正在尋找應用樸素貝葉斯在它的matlab。我想知道的是KDD數據集數據的494021x42陣列,如果你注意到了樸素貝葉斯代碼「培訓」和「target_class」下面: training = [1;0;-1;-2;4;0]; % this is the sample data. target_class = ['posi';'zero';'negi';'ne

    -1熱度

    3回答

    我在R中尋找一個簡單的MCMC貝葉斯網絡推理函數/包。基本上,我只是想要一個函數接受包含我的樣本的矩陣x我的變量(+可選參數, in和迭代計數)並返回推斷網絡的鄰接矩陣。 我一直在使用Matlab工具包「BayesNet」,它提供了一個簡單的「learn_struct_mcmc」函數,它提供了我正在尋找的大部分內容。我正在尋找一個相當於R. 我一直在尋找http://cran.r-project.

    2熱度

    1回答

    我的程序使用來自用戶的一定數量的簇的K均值聚類。對於這個k = 4,但我想通過matlabs樸素貝葉斯分類器運行聚類信息。 有沒有辦法將簇分割並將它們饋入matlab中不同的樸素分類器? 樸素貝葉斯: class = classify(test,training, target_class, 'diaglinear'); K均值: %% generate sample data K = 4;