我使用JOBLIB救了我的分級管道:帶來一個分類,以生產
vec = TfidfVectorizer(sublinear_tf=True, max_df=0.5, ngram_range=(1, 3))
pac_clf = PassiveAggressiveClassifier(C=1)
vec_clf = Pipeline([('vectorizer', vec), ('pac', pac_clf)])
vec_clf.fit(X_train,y_train)
joblib.dump(vec_clf, 'class.pkl', compress=9)
現在我想要在生產ENV使用它:
def classify(title):
#load classifier and predict
classifier = joblib.load('class.pkl')
#vectorize/transform the new title then predict
vectorizer = TfidfVectorizer(sublinear_tf=True, max_df=0.5, ngram_range=(1, 3))
X_test = vectorizer.transform(title)
predict = classifier.predict(X_test)
return predict
我是錯誤得到是:ValueError:詞彙不適合或是空的! 我想我應該從德joblid加載的詞彙,但我不能讓它的工作
存儲/加載矢量器時會出現什麼錯誤? – 2014-09-11 17:06:50
加載時我沒有收到錯誤,現在問題已解決。比你的幫助 – Ruben 2014-09-11 19:40:48