bayesian

1熱度

2回答

我正在與2 features和2000 rows作爲訓練分類數據xtrain matrix，所以尺寸爲2，μ是一個2元素矢量和Σ是covariancxe矩陣的2×2： xtrain = 0.3630 1.6632 -0.0098 1.8526 -0.0424 1.6840 -0.1565 2.1187 0.5720 -2.7282 -0.

2熱度

1回答

洪水貝葉斯評分創造價值超出範圍

我試圖以應用Bayesian rating formula，但如果我評級1 5000數百名，最終評級是大於5 例如，一個給定的項目沒有投票，經過投票17萬次，1星，最終評分爲5.23。如果我評價爲100，則它具有正常值。這是我在PHP中的。 <?php // these values came from DB $total_votes = 2936; // total of votes f

1熱度

1回答

理想的算法方法 - 規則引擎/決策樹和一些學習邏輯？

我的要求可能接近「專家系統」的預期。並尋找最簡單的解決方案，它可以給我實時或接近實時的推斷，以及一些離線（非實時）學習功能。爲了詳細說明，我的問題是 - 觀看正在直播更新日誌，每個條目爲紅色，綠色和藍色的分類。紅，綠，藍的分類是基於編纂爲生產規則的邏輯（正如我今天的想象）。那裏得到挑戰的一點是 - 1）登錄項標記藍最終還是要根據隨後的日誌條目，我們希望有更多的詳細信息標記紅色/綠色，所以有有

2熱度

2回答

Ruby中的樸素貝葉斯

我們試圖在Ruby中做樸素貝葉斯分類。目前我們使用的http://ai4r.rubyforge.org/ ，我們不能把它用於浮點值工作，並與字符串值低約20個百分點的準確性。使用浮點數/整數我們得到一個[]沒有從零到整數的隱式轉換。我們用to_s轉換浮動。有沒有辦法讓浮動值工作？如果不是什麼替代寶石ai4r的紅寶石或替代算法幼稚bayes？

3熱度

2回答

Tweet價值預測：什麼樣的分析（貝葉斯？）可能預測Twitter用戶會評價推文的價值多少？

我正在考慮爲TalkingPuffin Twitter客戶端添加一項功能，在該功能對用戶進行一些培訓後，它可以根據他們的預測值對傳入的推文進行排名。 Java虛擬機（Scala或Java首選）有什麼解決方案來完成這種事情？

0熱度

2回答

分類器算法的參數優化

據說不同的算法有不同的參數。我真的不認爲這是真的，比如說如果它是樹決策算法和樸素貝葉斯算法，那麼每個參數是什麼？有人能給我一個例子.. 如果是這樣的話，那麼對於將要使用決策樹算法運行的數據做5倍交叉驗證與貝葉斯是不同的嗎？另外爲了參數優化，我會做5倍交叉驗證。有沒有辦法自動做到這一點，以確定使用weka參數的設定值鍵？

6熱度

1回答

什麼是一個很好的開源軟件包，用於在大型Rails站點上構建靈活的垃圾郵件檢測？

我的網站越來越大，它開始通過各種渠道吸引大量垃圾郵件。該網站有許多不同類型的UGC（配置文件，論壇，博客評論，狀態更新，私人信息等）。我正在進行各種緩解工作，我希望以閃電般的方式進行部署，以說服垃圾郵件發送者我們不是一個有價值的目標。我對自己在做功能方面有很高的信心，但是一個缺失的部分是一次性清除所有舊垃圾郵件。這是我有：大良/不良語料庫（5位數不好，6或7位數的好）。很多垃圾郵件都有非常可靠

0熱度

2回答

如何預測數據質量？

我非常抱歉，如果我提前寫錯了這句話，但是我有一個很大的數據集，我試圖分析它，但是大部分數據都不正確，需要一些幫助來確定如何選擇正確的數據。這裏有一些更多的信息來清除它。例如，我有以下幾點： color value quantity red 20 2 blue 5 8 green 10 2 total 100 如果只值和總被賦予的，我會發現有36個可能的答案： #1 Found

3熱度

2回答

如何使用樸素貝葉斯實現TF_IDF特徵加權

我試圖實施樸素貝葉斯分類器進行情感分析。我計劃使用TF-IDF加權措施。我現在只是有點卡住了。 NB通常使用單詞（特徵）頻率來查找最大似然。那麼如何在樸素貝葉斯中引入TF-IDF加權測度呢？

3熱度

2回答

從命令行運行秧雞 - 找不到類NaiveBayes

我試圖從運行條命令線的Weka分類，但我的代碼： java weka.classifiers.bayes.NaiveBayes -t file1.arff -T file2.arff -p 想出了錯誤消息：「莫非找不到主要類：weka.classifiers.bayes.NaiveBayes。程序將退出。「我在包含weka.jar的目錄中運行該命令。它怎麼找不到分類器？