svmlight

    0熱度

    1回答

    我是機器學習的新手。當我嘗試通過門進行學習時,它顯示出一些錯誤。學習配置文件如下。 <?xml version="1.0"?> <ML-CONFIG> <SURROUND value="false"/> <FILTERING ratio='0.2' dis='far'/> <EVALUATION method="holdout" runs="2" ratio="0.66"/> <

    0熱度

    1回答

    我使用SVM Light對用OpenCV處理的圖像進行分類。圖像製作成黑白,模糊一點,而來自opencv的HOG檢測器用於創建一個特徵向量,其中帶有標記爲1的正像和具有-1的負像的向量。當我在7個正面和7個負面過程圖像上運行SVMLight火車文件時,它會錯誤分類7個負面文件中的4個。 但是,在較大的輸入下,它訓練時沒有錯誤分類。有誰知道爲什麼這可能是這種情況? Correctly classif

    0熱度

    1回答

    我今天遇到了text2vec軟件包,這正是我需要解決特定問題的原因。但是,我一直無法弄清楚如何將使用text2vec創建的dtm導出到某種輸出文件。我的最終目標是使用text2vec在R中生成特徵,並將生成的矩陣導入到H2O中進行進一步建模。 H2O可以讀取CSV或SVMLight格式。 我創建的第一個是987753 x 8806 sparse Matrix of class "dgCMatrix

    0熱度

    1回答

    我以創建Azure ML web服務爲例,在部署Web服務時遇到未知錯誤。錯誤沒有解釋,所以很難追蹤。 在演播室內運行實驗時,實驗運行時沒有任何問題。但是,當部署到webservice時,測試功能失敗,輸入與錄音棚中相同。 我也發佈了一個服務的樣本,以查看是否有人可以看到問題是什麼。 https://gallery.cortanaintelligence.com/Experiment/mywebs

    1熱度

    1回答

    我與形式的值的svmlight格式的文件: 92.91 18256731:1 71729421:1 72329637:1 83328561:1 118265976:1 134892759:1 198163358:1 352348616:1 526943048:1 5.30 102156934:1 134892759:1 198163358:1 254112843:1 262373758:1 512

    1熱度

    1回答

    我使用svm light文件作爲稀疏矩陣的存儲。 的測試表明,對於31700108x54070矩陣570601944個條目 import xgboost as xgb dtrain = xgb.DMatrix(train_file) 使用21秒,方式快於 from sklearn.datasets import load_svmlight_file x_train, y_train = l

    2熱度

    1回答

    load_svmlight_file()溢出錯誤: from sklearn.datasets import load_svmlight_file from sklearn.datasets import dump_svmlight_file dump_svmlight_file(toy_data.drop(["Output"], axis=1),toy_data['Output'],"../da

    0熱度

    1回答

    輸出svm_learn train.dat model.out Scanning examples...done Reading examples into memory...100..200..300..400..500..Features must be in increasing order!!! : Undefined error: 0 LINE: -1 1:5 14:14 21:1

    1熱度

    1回答

    e1071的SVM成本似乎與svmlight的成本不同。 e1071庫的使用手冊對其成本參數說明如下定義: cost of constraints violation (default: 1)—it is the ‘C’-constant of the regular- ization term in the Lagrange formulation 這基本上是未命中分類的允許範圍。存在由s

    -1熱度

    1回答

    我目前正在進行多標籤分類。作爲分類器,我使用SVMlight並將多標籤問題二值化。這意味着在我的情況下超過1000分類運行。 我有一個固定的特徵尺寸1000,模型的培訓需要超過3天(2 GHz Intel Core 2 Duo,8 GB)。有沒有人經歷,如果它是常見的,它需要很長時間,或者你可以給我任何建議如何提高性能?你認爲對高性能機器的改變會產生很大的影響嗎? 在此先感謝!