2012-12-19 60 views
1

我的數據由以下對象組成。在這種情況下可以使用哪些機器學習算法?

OBJ1 - 顏色 - 形狀 - 大小 - 價格 - 排名

所以我想能夠預測顏色/形狀/大小的什麼樣的組合/價格是一個很好的組合,以獲得高的排名。或者甚至一個組合可以工作,例如:爲了獲得良好的排名,ALG預測這種顏色和這種形狀的最佳性能。類似的東西。

這種預測的可行算法是什麼?

也可以,如果你可以簡要解釋我如何可以接近模型建設,我真的很感激它。對於例如:我的數據看起來像

Blue pentagon small $50.00 #5 
Red Squre large $30.00 #3 

那麼,我應該看看什麼是有用的預測模型?我應該嘗試預測什麼算法,比如說最高權重是價格,然後是顏色,然後是大小。如果我想像組合一樣預測紅色小形狀與粉紅色小形狀相比不太可能更高級別。 (本質上試圖結合多個名義值列來進行預測)

回答

0

將組合作爲線性方程,並應用蒙特卡羅算法(如遺傳算法)來調整方程的參數。


  1. 代碼的顏色/形狀/尺寸/價格/排名爲數字值。

  2. 將組合處理爲線性方程,比如a*color + b*shape + c*size + d*price = ranking

  3. 應用遺傳算法調諧/ B/C/d,爲了使計算rankings是作爲更接近地面實況越好。

  4. 最後你得到的公式,你可以用它來:

    1)找到最大的排名通過簡單的線性規劃;

    2)預測排名通過只分配其他參數。

+0

你可以請看看這個問題嗎?http://stackoverflow.com/questions/13983955/how-can-i-use-the-rule-based-learning-algorithms-for-this-example – ExceptionHandler

+0

I我正在努力做到這一點。這個問題我並沒有真正找到理想的答案。所以我提出了實際問題與實際樣本數據的求助。 – ExceptionHandler

+0

@ExceptionHandler我沒有指出這個問題。你已經提出了9個問題,但只接受其中2個:-) – Skyler

2

聽起來像你想學習模型,你可以解釋爲一個人。根據您的排名變量的類型,可能會有許多不同的學習者。

如果排序是分類(例如星星),分類器可能是最好的。 Weka有很多。一些產生人可以理解的模型是決策樹學習者和OneR規則學習者。

如果排名是連續的(例如分數),迴歸可能更合適。合適的算法是例如SimpleLogisticLinearRegression

或者,您可以嘗試使用Weka中的任何算法對您的示例進行聚類,然後分析羣集。也就是說,羣集中的理想示例都是相同(或非常相似)的排名,您可以查看其他屬性的值範圍並繪製您自己的結論。

+0

非常感謝您的看法。我稍微瞭解了一點J48,所以我一定會嘗試一下。我需要一些關於如何修改數據的建議。現在,我的數據都是名義屬性。像黃色,圓形,中等,19.99美元,#458(等級)。那麼你如何建議,我嘗試去模擬它。或者我應該看到什麼樣的產出? – ExceptionHandler

+0

'J48'只能處理分類數據,所以原則上不需要修改。將價格轉換爲數字是有道理的(只需刪除$符號)。看到示例排名#458表明分類不是最好的方法,但(沒有類)。我建議你嘗試迴歸。根據您選擇的算法,您可能需要將數據轉換爲數字(例如,地圖小 - > 0,中 - > 1,大 - > 2等)。 –

+0

如果我使用0,1,2等,算法不會使用字面值而不是將它們用作不同的類? – ExceptionHandler

相關問題