feature-selection

0熱度

1回答

我之前在MATLAB中使用sequentialfs函數之前只使用大型矩陣作爲參數。我有一個新升級的MATLAB，其中包含Table數據類型 - 非常方便。我試圖重寫一個腳本，該腳本使用表設置來執行順序特徵選擇，但遇到了麻煩。 normfmat = ngmft(:,4:end-1); % ngmft is previously loaded data table y = gmft(:,2); %

1熱度

1回答

正交匹配追蹤

我在Python運行正交匹配追蹤算法，並得到以下警告： RuntimeWarning：正交匹配追蹤提前結束，由於在字典中的線性關係。要求的精度可能未達到要求。我該如何刪除字典中的線性依賴關係？

1熱度

4回答

如何在另一列上按組條件執行連續的列計數

我試圖從由PatientID列分組的Noshow列中獲取連續計數。我使用的下面的代碼非常接近我希望獲得的結果。但是，使用sum函數將返回整個組的總和。我希望求和函數只求和當前行和只有其上面有'1'的行。基本上，我試圖計算一個病人不遵守每行的預約時間，然後在他們確實顯示時重置爲0。似乎只需要對我的下面的代碼進行一些調整。但是，我似乎無法在本網站的任何地方找到答案。 transform(df, Con

1熱度

1回答

PCA後提取哪些特徵？

我正在嘗試使用PCA提取功能。現在我得到了來自StackExchange的MATLAB代碼，如下所示，它選擇PCA之後最相關的前100個功能。現在，當我執行代碼時，我發現特徵值已經在第一條語句中排序。爲什麼我們需要再次按降序排序？ [eigenvectors, projected_data, eigenvalues] = princomp(proteingene); [foo, feature_

1熱度

4回答

語音識別所需的MFCC功能

我目前正在開發語音識別項目，並試圖選擇最有意義的功能。大部分相關論文都建議使用零交叉率，F0和MFCC功能，因此我正在使用這些功能。我的問題是，持續時間爲00:03的訓練樣本有268個特徵。考慮到我正在做一個多類分類項目，每個類訓練包含50+個樣本，包括所有MFCC特徵可能會受到維度詛咒或「降低其他特徵的重要性」項目的影響。所以我的問題是，我應該包括所有MFCC功能，如果不是，你可以建議一個

0熱度

3回答

如何使用sklearn獲取無用功能列表？

我有一個數據集建立一個classificator： dataset = pd.read_csv(sys.argv[1], decimal=",",delimiter=";", encoding='cp1251') X=dataset.ix[:, dataset.columns != 'class'] Y=dataset['class'] 我想只選擇重要的功能，所以我做的： clf=svm.

2熱度

1回答

功能選擇

我試圖用scikit學習下面的代碼遞歸功能選擇。 from sklearn import datasets, svm from sklearn.feature_selection import SelectKBest, f_classif from sklearn.feature_selection import RFE import numpy as np input_file_iri

0熱度

1回答

SVM分類中的特徵選擇 - 奇怪行爲

我正在使用UCI ML乳腺癌數據集來構建使用SVM的分類器。我使用LIBSVM和它的fselect.py腳本來計算特徵選擇的f分數。我的數據集有8個功能，其評分如下： 5: 1.765716 2: 1.413180 1: 1.320096 6: 1.103449 8: 0.790712 3: 0.734230 7: 0.698571 4: 0.580819 這意味着第5個功能是最

1熱度

3回答

spark ml：如何找到功能重要性

我是ML新手，我正在使用Spark ml構建預測系統。我讀到，特徵工程的一個主要部分就是在做所需的預測時發現每個特徵的重要性。在我的問題中，我有三個分類特徵和兩個字符串特徵。我使用OneHotEncoding技術來轉換分類特徵，並使用簡單的HashingTF機制來轉換字符串特徵。然後，這些信息作爲管線的各個階段輸入，包括ml NaiveBayes和VectorAssembler（將所有特徵組裝成一

0熱度

2回答

我如何解決weka上的這個錯誤？

我想插入大尺寸的csv文件到Weka中進行特徵選擇。 csv文件大小約爲2.3GB，它包含41行2000,002列。第一行包含（sample_id）（1〜200萬）（類）和從第二線 ID浮球浮子...類（Y/N）然而當嘗試將此文件插入weka，彈出錯誤消息： weka.core.coverters.CSVLoader未能加載'test.csv'。原因：錯誤數值。閱讀1000002，預計1