bayesian

    1熱度

    2回答

    我正在與2 features和2000 rows作爲訓練分類數據xtrain matrix,所以尺寸爲2,μ是一個2元素矢量和Σ是covariancxe矩陣的2×2: xtrain = 0.3630 1.6632 -0.0098 1.8526 -0.0424 1.6840 -0.1565 2.1187 0.5720 -2.7282 -0.

    2熱度

    1回答

    我試圖以應用Bayesian rating formula,但如果我評級1 5000數百名,最終評級是大於5 例如,一個給定的項目沒有投票,經過投票17萬次,1星,最終評分爲5.23。如果我評價爲100,則它具有正常值。 這是我在PHP中的。 <?php // these values came from DB $total_votes = 2936; // total of votes f

    1熱度

    1回答

    我的要求可能接近「專家系統」的預期。並尋找最簡單的解決方案,它可以給我實時或接近實時的推斷,以及一些離線(非實時)學習功能。 爲了詳細說明,我的問題是 - 觀看正在直播更新日誌,每個條目爲紅色,綠色和藍色的分類。 紅,綠,藍的分類是基於編纂爲生產規則的邏輯(正如我今天的想象)。 那裏得到挑戰的一點是 - 1)登錄項標記藍最終還是要根據隨後的日誌條目,我們希望有更多的詳細信息標記紅色/綠色,所以有有

    2熱度

    2回答

    我們試圖在Ruby中做樸素貝葉斯分類。 目前我們使用的http://ai4r.rubyforge.org/ ,我們不能把它用於浮點值工作,並與字符串值低約20個百分點的準確性。使用浮點數/整數我們得到一個[]沒有從零到整數的隱式轉換。我們用to_s轉換浮動。 有沒有辦法讓浮動值工作?如果不是什麼替代寶石ai4r的紅寶石或替代算法幼稚bayes?

    3熱度

    2回答

    我正在考慮爲TalkingPuffin Twitter客戶端添加一項功能,在該功能對用戶進行一些培訓後,它可以根據他們的預測值對傳入的推文進行排名。 Java虛擬機(Scala或Java首選)有什麼解決方案來完成這種事情?

    0熱度

    2回答

    據說不同的算法有不同的參數。我真的不認爲這是真的,比如說如果它是樹決策算法和樸素貝葉斯算法,那麼每個參數是什麼?有人能給我一個例子.. 如果是這樣的話,那麼對於將要使用決策樹算法運行的數據做5倍交叉驗證與貝葉斯是不同的嗎? 另外爲了參數優化,我會做5倍交叉驗證。有沒有辦法自動做到這一點,以確定使用weka參數的設定值鍵?

    6熱度

    1回答

    我的網站越來越大,它開始通過各種渠道吸引大量垃圾郵件。該網站有許多不同類型的UGC(配置文件,論壇,博客評論,狀態更新,私人信息等)。我正在進行各種緩解工作,我希望以閃電般的方式進行部署,以說服垃圾郵件發送者我們不是一個有價值的目標。我對自己在做功能方面有很高的信心,但是一個缺失的部分是一次性清除所有舊垃圾郵件。 這是我有: 大良/不良語料庫(5位數不好,6或7位數的好)。很多垃圾郵件都有非常可靠

    0熱度

    2回答

    我非常抱歉,如果我提前寫錯了這句話,但是我有一個很大的數據集,我試圖分析它,但是大部分數據都不正確,需要一些幫助來確定如何選擇正確的數據。 這裏有一些更多的信息來清除它。例如,我有以下幾點: color value quantity red 20 2 blue 5 8 green 10 2 total 100 如果只值和總被賦予的,我會發現有36個可能的答案: #1 Found

    3熱度

    2回答

    我試圖實施樸素貝葉斯分類器進行情感分析。我計劃使用TF-IDF加權措施。我現在只是有點卡住了。 NB通常使用單詞(特徵)頻率來查找最大似然。那麼如何在樸素貝葉斯中引入TF-IDF加權測度呢?

    3熱度

    2回答

    我試圖從運行條命令線的Weka分類,但我的代碼: java weka.classifiers.bayes.NaiveBayes -t file1.arff -T file2.arff -p 想出了錯誤消息: 「莫非找不到主要類:weka.classifiers.bayes.NaiveBayes。程序將退出。「 我在包含weka.jar的目錄中運行該命令。 它怎麼找不到分類器?