2016-09-30 44 views
0

我訓練的模型與特徵矩陣尺寸(200716),其中,200是文檔716的數量和被總feature.Now的編號i想測試與模型輸入測試數據具有特徵詞(7)1。如何能夠映射此功能完全相同的許多特徵的,其中我們的模型得到培訓,這樣,我可以使用model.predict(TEST_DATA)功能用於檢查的預測新數據模型。輸入測試數據改變成特徵矩陣的維

+0

你應該提供更多的細節關於你的問題,也許一個例子來幫助理解這個問題。例如:您是否使用某種指標變量矩陣來表示您的數據?文檔中的特徵詞是什麼? – raghu

回答

0

答案會不會對你來說不錯,但......你必須使用你在第一個地方用同樣的方法。沒有一般,「神奇」實現這一目標,你必須在原始格式的培訓文檔,並通過一些改造f你把它映射到功能的方式,你必須存儲轉換本身(的功能,它的字典等等。)。如果你刪除它,你什麼都不能做。通常,您將以pickle文件或您選擇的任何其他格式保存模型(分類器)和預處理流水線(f,從數據到特徵的轉換)。然後,在預測期間,您只需加載兩個零件並將其重新應用於新數據。