我試圖在scikit-學會TfidfVectorizer給出稀疏矩陣這就給申請TruncatedSVD.fit_transform():截斷SVD給值誤差數組太大
tsv = TruncatedSVD(n_components=10000,algorithm='randomized',n_iterations=5)
tfv = TfidfVectorizer(min_df=3,max_features=None,strip_accents='unicode',analyzer='word',token_pattern=r'\w{1,}',ngram_range=(1, 2), use_idf=1,smooth_idf=1,sublinear_tf=1)
tfv.fit(text)
text = tfv.transform(text)
tsv.fit(text)
Value error : array is too big
什麼其他方法我可以使用或降維。
那你的數據有多大? –
77946X45906類型爲numpy.float64的稀疏矩陣,包含1062178個存儲元素。 – Harshit
然後請發佈完整的回溯。很難看到錯誤來自哪裏。 –