2013-03-02 34 views
1

我必須對155個圖像特徵向量進行比較。每個特徵向量都有5個特徵。 我的圖像分爲10個類。 不幸的是,我需要至少100張圖片才能使用支持向量機,還有其他選擇嗎?在Python中支持向量機分類器的替代方案嗎?

+0

kNN在那裏,但可能不如SVM。 – 2013-03-02 17:46:36

+0

它使用歐幾里德距離度量,混合所有值不擔心有不同的特徵 – postgres 2013-03-02 17:47:28

+5

只有155個樣本和10個類別,你嘗試的任何分類器都不會給你非常樂觀的結果。但是你可以嘗試象「RandomForestClassifier」這樣的合奏。 – jitendra 2013-03-02 17:51:44

回答

6

對於任何機器學習模型,每類15個樣本非常低。與其浪費時間嘗試許多模型類和參數,您應該手工收集並標記新示例。這將會更有成果。如果您有一堆未標記的圖片,則可以使用服務,如https://www.mturk.com/

+0

mturk這不是免費的,也許更容易找到一個指標,手動分析功能 – postgres 2013-03-02 21:35:41

+0

如果你只有10個可能的類,mturk上的圖像分類任務可能會找到工作人員只需要0.01美元的圖像,使註釋的成本爲100個額外的圖像(只要你有他們在第一個地方)只有1美元。 關閉當然,您仍然可以直接爲自己添加標籤。如果你有成千上萬的話,它會花更長的時間。 – ogrisel 2013-03-02 23:39:55

0

檢查出pybrain。 http://pybrain.org。並且可能使用神經網絡,因爲我聽說他們需要的訓練數據比svm少,但不太準確。

0

如果屬於同一類的圖像是轉換爲某個起始圖像的結果,那麼可以通過將標籤化示例轉換爲標籤來增加訓練尺寸。

例如,如果您正在進行字符識別,可以使用afine或彈性變形。 P.Simard在應用於可視化文檔分析的卷積神經網絡最佳實踐中對其進行了更詳細的描述。在他使用神經網絡的論文中,但同樣適用於SVM。