我想知道我可以做的實驗的算法列表,以根據輸入集合預測癌症或發熱或患者身上的任何事情。 。假設我有數以百萬計的數據,所以我想嘗試最好的算法來預測...我對數據挖掘和機器學習非常陌生......我想要預測/預測算法列表,我可以嘗試進行樣本實驗
回答
如果您正在專門研究估計某些事物的概率,那麼您需要使用生成概率的機器學習方法。大多數只生成一個類標籤:是/否。
最着名的估計概率的算法是Logistic迴歸。實現可在Weka中找到。
Weka的J48決策樹比癌症數據的邏輯迴歸具有更好的準確性。根據數據您需要測試不同的算法並應用。看看你是否沒有過度配合。 – 2018-02-05 09:52:06
這個問題有點含糊,我可以只給出一個模糊的答案:使用全能的SVM!爲您的數百萬輸入向量提供SVM分類器,並且它應該能夠在之後爲您提供最新的預測。
如果您正在尋找SVM的實現,請查看libsvm,它幾乎包含所有正常的編程語言中的包裝。
爲全能SVM +1! – Stompchicken 2011-06-14 10:41:05
用於開始大量機器學習庫實驗的最流行的工具是Weka。在這裏你可以上傳你的數據並嘗試許多算法。它的弱點在於可擴展性,但對數據編排來說並不是問題。
當前和最流行的預測和分類算法之一是利奧佈雷曼的Random Forests (RF)。它的實現也可以在weka中找到。
- 1. 我可以使用不同數量的預測變量對測試數據進行預測嗎?
- 2. Python中的樣本預測ARIMA預測()
- 3. 插入符號:嘗試預測但預測行不同
- 4. 我們可以使用nlmrt軟件包進行nlxb預測嗎?
- 5. 我如何測量我的算法的預測功率?
- 6. Word預測算法
- 7. 在實習生中進行測試的代碼是否需要預先測試?
- 8. 使用ns()進行樣條預測
- 9. 我可以使用機架測試進行部署測試嗎?
- 10. 迴歸 - 樣本外預測
- 11. Rails 3 - 表單驗證 - 預測試?
- 12. 我可以使用身份驗證器進行測試嗎?
- 13. 計算/預測方法
- 14. rand%以可預測的模式產生我所有的實體
- 15. 我可以用我的WatiN測試來進行壓力測試嗎?
- 16. Firebase測試實驗室可以運行Monkeyrunner測試嗎?
- 17. 我可以使用哪種算法進行quadrilater/cube檢測?
- 18. 如何脫身的樣本外預測,從預測功能
- 19. 我需要將我的預測數據可視化
- 20. 單元測試:干與可預測性
- 21. 我可以使用什麼來進行本地MySQL測試?
- 22. 當我嘗試預測R中的類概率時出錯 - caret
- 23. 從CV進行預測
- 24. 使用LSTM進行預測
- 25. 從時間序列進行預測?
- 26. 如何測試我的雙擊預防?
- 27. 試圖運行地預測
- 28. 我如何爲一組圖像準備訓練集?所以我可以預測我的測試數據
- 29. 使用`dygraphs`預測'預測'預測
- 30. 我需要的想法進行單元測試這種方法的任務
我對算法一無所知,但也許那些知道需要更多信息。例如輸入等的例子?也許描述一個測試用例? – Steven 2011-06-13 21:45:07
你的預算是多少? – revdrjrr 2011-06-13 21:45:07