2016-06-22 40 views
-1

我需要對傳入汽車租賃進行分類,但是我可以用於培訓的歷史數據是「分組」形式的,我無法瞭解如何訓練分類模型。關於分類方法的建議

我的接收數據是汽車型號,數量和單位價格的列表:

Chevrolet Spark, 1, 196.91 
Fiat 500, 1, 196.91 
Toyota Prius Hybrid, 3, 213.73 

該輸入數據當前手動分類並保存由類和每組總價分組(雪佛蘭和菲亞特是經濟普銳斯是混合):

Economy, 393.82 
Hybrid, 641.19 

這個問題應該通過機器學習可以解決的,但我無法弄清楚如何建立一個訓練集的監督分類。任何指導讚賞。

感謝

回答

0

樸素貝葉斯分類應該做你正在嘗試做的......你可以用價格作爲功勳使用,從什麼已經被標記學習。

但是,我不明白如何使用總價格進行分類以獲得一致的數據,因爲您並不總是擁有從一個組到另一個組的許多對象......您將不得不使用單位價格。

+0

問題是我沒有任何標籤,我沒有菲亞特標記爲經濟其他地方用戶的頭/紙上。或者我誤解了你? –

+0

@joe_c您不能使用已經手動分類爲標記火車集的示例嗎?編輯:分類只在紙上?人工手動分類不能在電腦上完成? – Carele

+0

的確,它是和手動完成的,並且標記不保存在任何地方。 就是這樣,因爲數據進來紙(幾十行),而不是衝壓許多行,他們分組,並註冊只有幾個分組行。 –

0

有很多算法可以提供多類分類,但是您能否更詳細地解釋您想要預測的內容?從你寫的內容來看,這聽起來更像ETL過程而不是機器學習模型。

如果我正確理解你的例子,「Chevy Spark」或「Fiat 500」汽車模型的入場記錄將始終標記爲「Economy」,而帶有「Toyota Prius Hybrid」將被標記爲「混合」。一個簡單的查找表可以完成這項工作 - 不需要花哨的機器學習數學。 :)

+0

我嘗試根據分組的歷史數據來預測汽車的標籤(所以我沒有清潔汽車 - >標籤數據來構建查找)。你是對的,Chevy Spark和菲亞特500將永遠被貼上經濟標籤等,我只是希望我能用ML來識別汽車的標籤:) –