joblib

    1熱度

    1回答

    我在Python中保存了很多離線模型/矩陣/數組,並且遇到了這些函數。有人可以幫我列出numpy.save()和joblib.dump()的優點和缺點嗎?

    6熱度

    1回答

    說我設置記憶化與Joblib如下(使用該解決方案提供here): from tempfile import mkdtemp cachedir = mkdtemp() from joblib import Memory memory = Memory(cachedir=cachedir, verbose=0) @memory.cache def run_my_query(my_quer

    0熱度

    1回答

    我有一些相當大的數據集,我正在使用。從本質上講,我使用scikit-learn在內存映射的numpy數組上運行一些工具,因爲它似乎允許我使用大於我的計算機上允許的內存大的數據集。 我比較喜歡joblib做內存映射,因爲你只需要指定文件。 但我似乎無法弄清楚如何分配一個新的空的,比如說1億個由200個numpy數組使用joblib而不加載所有內存。 謝謝!

    4熱度

    1回答

    我使用JOBLIB救了我的分級管道: vec = TfidfVectorizer(sublinear_tf=True, max_df=0.5, ngram_range=(1, 3)) pac_clf = PassiveAggressiveClassifier(C=1) vec_clf = Pipeline([('vectorizer', vec), ('pac', pac_clf)]) ve

    0熱度

    1回答

    我繼承了誰離開我的公司同事的一些代碼,我注意到,他寫了一封電子郵件開放的預測並沒有在幾周內運行。所以,我試圖運行它。它得到了這一行: clf_predict = joblib.load(os.path.join(data_dir,'trained_random_forest.pkl')) ,結果是這樣的: File "/usr/local/lib/python2.7/distpackages/sk