2014-01-25 14 views
0

我正在遵循一個受歡迎的教程 here,其中我試圖嘗試使用支持向量機的rbf內核參數gamma和C的效果在sci-kit學習。在scikit-learn教程中可視化支持向量機的參數

對於上述教程,我有點困惑,什麼這部分的代碼的目的是做我們:

# dataset for decision function visualization 
X_2d = X[:, :2] 
X_2d = X_2d[Y > 0] 
Y_2d = Y[Y > 0] 
Y_2d -= 1 

我假設我們進行子集原始數據(來自虹膜數據集),但是
爲什麼我們首先需要這樣做?爲什麼X_2d = X[:, :2]是一個元組的參數?

如果有人熟悉本教程,並已事先弄清楚了這一點,在此先感謝。

回答

2

該部分代碼用於可視化 - 第一個散點分佈圖,顯示了決策表面如何隨着不同的訓練參數而變化。基本上它只創建一個只有兩個特徵和兩個類的較小數據集。

X_2d = X[:, :2]意味着X_2d是隻包含前兩個特徵的數據集,因此每個點都可以方便地繪製(如何繪製4D點?)。

接下來的三行過濾掉標籤爲0的樣本,這樣較小的數據集只包含兩個標籤。它還將標籤重命名爲0或1.

+0

感謝您的出色答案。 –