2015-10-15 75 views
1

最近,我一直在講課和課文,並試圖理解SVM的使能如何用於更高維空間。支持向量機理解

在正常的邏輯迴歸中,我們使用這些特徵。但是在SVM中,我們使用一個映射幫助我們獲得非線性決策邊界。

通常情況下,我們直接使用特徵..但在內核技巧的幫助下,我們可以在數據中找到使用特徵之間的關係。產品之間的關係等。這是正確的

我們在內核的幫助下做到這一點。

Now..i明白,一個多項式覈對應於已知功能vector..but我無法理解什麼高斯核相當於(有人告訴我vector..but什麼無限維特徵?)

另外,我無法通過掌握內核是訓練樣例之間的相似度量的概念。how is this is a part of the SVM's working?

我花了很多時間試圖理解這些..但徒然。任何幫助將大大apprecciated!

感謝提前:)

+1

內核只是一個必須滿足一些預定義屬性(我不想列出它們,你可以自己找到它)的操作。在線性情況下,內核點積在非線性情況下被替換爲(比方說)高斯內核。點積也是某種意義上的相似度量,因爲如果它們之間的角度減小,則在兩個向量之間得到更大的點積的結果。 –

+0

當我們使用svm時,爲什麼我們需要一個相似性度量值?根據我的理解,使用內核我們可以通過使用更高維特徵向量來找到非線性決策邊界。 –

+1

相似性是距離的倒數。對於線性情況,距離函數是簡單的畢達哥拉斯距離,用線性向量操作實現。 「核心技巧」應用非線性距離函數。另一種考慮它的方式是內核技巧搜索距離度量標準,該距離度量標準將空間轉換爲分離超平面*爲*線性的位置。 – Prune

回答

1

通常我們直接與features..but與核技巧的幫助下,我們可以使用features..product的平方之間etc..is發現數據關係工作這正確嗎?

即使使用你仍然與功能工作,你可以簡單地利用這些功能更復雜關係的內核。例如在您的示例中 - 多項式內核使您可以訪問要素之間的低度多項式關係(例如正方形或要素的乘積)。

Now..i明白,一個多項式覈對應於已知功能vector..but我無法理解高斯覈對應於(有人告訴我vector..but什麼無限維特徵?)

高斯內核將您的特徵向量映射到未歸一化的高斯概率密度函數。換句話說,您將每個點映射到函數的空間,其中您的點現在是一個以此點爲中心的高斯(其方差對應於高斯內核的超參數伽瑪)。內核始終是向量之間的點產品。特別是,在函數空間L2我們定義了經典的點積作爲一個整體在產品,所以

<f,g> = integral (f*g) (x) dx 

其中f,g是高斯分佈。幸運的是,對於兩個高斯密度,他們積的積分是也是高斯,這就是爲什麼高斯核與高斯分佈的pdf函數如此相似。

此外,我無法理解內核是訓練實例之間的相似性度量的概念..這是SVM工作的一部分嗎?

如前所述,內核是一個點積,和點積可被視爲相似性的量度(當兩個矢量具有相同的方向被最大化)。然而,它不會以其他方式工作,您不能將每個相似性度量用作內核,因爲不是每個相似性度量都是有效的點積。

+0

因此,我們可以利用原始屬性之間的複雜關係。如何將其轉化爲高斯核心。如果我理解正確,那麼應用於2個向量時的內核會給出一個相似度量度。如何在分類任務中提供這種幫助因此? –

+0

它有助於構建複雜的決策邊界。支持向量機是一種線性模型,它只能表示線性依賴關係,因此決策邊界是一個超平面。使用多項式內核,您可以在誘導空間中獲得超平面,這將轉化爲輸入空間中更復雜的決策形狀。最後,在函數空間中導致超平面的rbf給出了一個決定邊界,它是高斯線性組合(非常非線性) – lejlot