將經過訓練的SVM從scikit-learn導入到OpenCV

我將一個使用Python支持向量機（使用scikit-learn）的算法移植到C++中（使用OpenCV的機器學習庫）。將經過訓練的SVM從scikit-learn導入到OpenCV

我有權訪問Python中訓練有素的SVM，並且我可以將XML文件中的SVM模型參數導入到OpenCV中。由於scikit-learn和OpenCV的SVM實現基於LibSVM，我認爲應該可以在OpenCV中使用經過訓練的scikit SVM的參數。

下面的示例顯示可用於在OpenCV中初始化一個SVM的XML文件：

<?xml version="1.0"?> 
<opencv_storage> 
<my_svm type_id="opencv-ml-svm"> 
    <svm_type>C_SVC</svm_type> 
    <kernel><type>RBF</type> 
    <gamma>0.058823529411764705</gamma></kernel> 
    <C>100</C> 
    <term_criteria><epsilon>0.0</epsilon> 
    <iterations>1000</iterations></term_criteria> 
    <var_all>17</var_all> 
    <var_count>17</var_count> 
    <class_count>2</class_count> 
    <class_labels type_id="opencv-matrix"> 
    <rows>1</rows> 
    <cols>2</cols> 
    <dt>i</dt> 
    <data> 
     0 1</data></class_labels> 
    <sv_total>20</sv_total> 
    <support_vectors> 
    <_> 
     2.562423055146794554e-02 1.195797425735170838e-01 
     8.541410183822648050e-02 9.395551202204914520e-02 
     1.622867934926303379e-01 3.074907666176152077e-01 
     4.099876888234874062e-01 4.697775601102455179e-01 
     3.074907666176152077e-01 3.416564073529061440e-01 
     5.124846110293592716e-01 5.039432008455355660e-01 
     5.466502517646497639e-01 1.494746782168964394e+00 
     4.168208169705446942e+00 7.214937388193202183e-01 
     7.400275229357797802e-01</_> 
    <!-- omit 19 vectors to keep it short --> 
    </support_vectors> 
    <decision_functions> 
    <_> 
     <sv_count>20</sv_count> 
     <rho>-5.137523249549433402e+00</rho> 
     <alpha> 
     2.668992955678978518e+01 7.079767098112181145e+01 
     3.554240018130368384e+01 4.787014908624512088e+01 
     1.308470223155845069e+01 5.499185410034550614e+01 
     4.160483074010306126e+01 2.885504210853826379e+01 
     7.816431542954153144e+01 6.882061506693679576e+01 
     1.069534676985309574e+01 -1.000000000000000000e+02 
     -5.088050252552544350e+01 -1.101740897543916375e+01 
     -7.519686789702373630e+01 -3.893481464245511603e+01 
     -9.497774056452135483e+01 -4.688632332663718927e+00 
     -1.972745089701982835e+01 -8.169343841768861125e+01</alpha> 
     <index> 
     0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 
     </index></_></decision_functions></my_svm> 
</opencv_storage>

我現在想從訓練的scikit學習SVM填補這個XML文件的值。但我不確定scikit-learn和OpenCV的參數是如何對應的。以下是我迄今爲止（clf在Python分類對象）：

<kernel><gamma>對應clf.gamma
<C>對應clf.C
<term_criteria><epsilon>對應clf.tol
<support_vectors>對應clf.support_vectors_

迄今爲止這是否正確？現在這裏是我不太確定的項目：

<term_criteria><iterations>？
是否<decision_functions><_><rho>對應clf.intercept_？
是否<decision_functions><_><alpha>對應clf.dual_coef_？在這裏，我不確定，因爲scikit-learn文檔中提到「dual_coef_其中包含產品y _iα_i」。它看起來像OpenCV預計只有α_我，而不是y _我α_我。

來源

2013-05-30 Robert Hegner

你不需要epsilon和iterations了，那些用於訓練優化問題。您可以將它們設置爲您最喜歡的號碼或忽略它們。

移植支持向量可能需要一些小竅門，因爲scikit-learn和opencv之間的索引可能不同。例如，您的示例中的XML沒有稀疏格式。

至於其他參數：

rho應該對應intercept_，但你可能需要改變的跡象。
scikit的dual_coef_對應sv_coef標準libsvm模型（這是alpha_i * y_i）。

如果opencv抱怨你移植時alpha提供值，使用scikit-learn的dual_coef_（例如，全爲正）的絕對值。這些是SVM模型的真正的alpha值。

來源

2013-05-30 14:18:02

謝謝你的回答。我還沒有嘗試過，但無論如何，你的答案包含一些非常有用的信息。我如何知道是否需要更改'intercept_'的符號？ –

@RobertHegner，你可以使用一些測試點，在scikit和opencv中是相同的。如果截距符號錯誤，則預測中的決策值將相差2 *截距。 –

就像其他人的參考一樣：我不必更改'intercept_'的符號，也不必使用'dual_coef_'的絕對值。它似乎工作得很好！再次感謝馬克！ –

將經過訓練的SVM從scikit-learn導入到OpenCV

回答

相關問題