feature-selection

    0熱度

    1回答

    我之前在MATLAB中使用sequentialfs函數之前只使用大型矩陣作爲參數。我有一個新升級的MATLAB,其中包含Table數據類型 - 非常方便。我試圖重寫一個腳本,該腳本使用表設置來執行順序特徵選擇,但遇到了麻煩。 normfmat = ngmft(:,4:end-1); % ngmft is previously loaded data table y = gmft(:,2); %

    1熱度

    1回答

    我在Python運行正交匹配追蹤算法,並得到以下警告: RuntimeWarning:正交匹配追蹤提前結束,由於在字典中的線性關係。要求的精度可能未達到要求。 我該如何刪除字典中的線性依賴關係?

    1熱度

    4回答

    我試圖從由PatientID列分組的Noshow列中獲取連續計數。我使用的下面的代碼非常接近我希望獲得的結果。但是,使用sum函數將返回整個組的總和。我希望求和函數只求和當前行和只有其上面有'1'的行。基本上,我試圖計算一個病人不遵守每行的預約時間,然後在他們確實顯示時重置爲0。似乎只需要對我的下面的代碼進行一些調整。但是,我似乎無法在本網站的任何地方找到答案。 transform(df, Con

    1熱度

    1回答

    我正在嘗試使用PCA提取功能。現在我得到了來自StackExchange的MATLAB代碼,如下所示,它選擇PCA之後最相關的前100個功能。現在,當我執行代碼時,我發現特徵值已經在第一條語句中排序。爲什麼我們需要再次按降序排序? [eigenvectors, projected_data, eigenvalues] = princomp(proteingene); [foo, feature_

    1熱度

    4回答

    我目前正在開發語音識別項目,並試圖選擇最有意義的功能。 大部分相關論文都建議使用零交叉率,F0和MFCC功能,因此我正在使用這些功能。 我的問題是,持續時間爲00:03的訓練樣本有268個特徵。考慮到我正在做一個多類分類項目,每個類訓練包含50+個樣本,包括所有MFCC特徵可能會受到維度詛咒或「降低其他特徵的重要性」項目的影響。 所以我的問題是,我應該包括所有MFCC功能,如果不是,你可以建議一個

    0熱度

    3回答

    我有一個數據集建立一個classificator: dataset = pd.read_csv(sys.argv[1], decimal=",",delimiter=";", encoding='cp1251') X=dataset.ix[:, dataset.columns != 'class'] Y=dataset['class'] 我想只選擇重要的功能,所以我做的: clf=svm.

    2熱度

    1回答

    我試圖用scikit學習下面的代碼遞歸功能選擇。 from sklearn import datasets, svm from sklearn.feature_selection import SelectKBest, f_classif from sklearn.feature_selection import RFE import numpy as np input_file_iri

    0熱度

    1回答

    我正在使用UCI ML乳腺癌數據集來構建使用SVM的分類器。我使用LIBSVM和它的fselect.py腳本來計算特徵選擇的f分數。我的數據集有8個功能,其評分如下: 5: 1.765716 2: 1.413180 1: 1.320096 6: 1.103449 8: 0.790712 3: 0.734230 7: 0.698571 4: 0.580819 這意味着第5個功能是最

    1熱度

    3回答

    我是ML新手,我正在使用Spark ml構建預測系統。我讀到,特徵工程的一個主要部分就是在做所需的預測時發現每個特徵的重要性。在我的問題中,我有三個分類特徵和兩個字符串特徵。我使用OneHotEncoding技術來轉換分類特徵,並使用簡單的HashingTF機制來轉換字符串特徵。然後,這些信息作爲管線的各個階段輸入,包括ml NaiveBayes和VectorAssembler(將所有特徵組裝成一

    0熱度

    2回答

    我想插入大尺寸的csv文件到Weka中進行特徵選擇。 csv文件大小約爲2.3GB,它包含41行2000,002列。 第一行包含 (sample_id)(1〜200萬)(類) 和從第二線 ID浮球浮子...類(Y/N) 然而當嘗試將此文件插入weka,彈出錯誤消息: weka.core.coverters.CSVLoader未能加載'test.csv'。原因:錯誤 數值。閱讀1000002,預計1