1
在生成TF-IDF模塊時,我剛剛面對這種矩陣向量計算。Python中的通用矩陣計算,TF-IDF
A % b = C
[[1,2], [3,4]] % [1/2, 1/3] = [[1/2, 2/3], [3/2, 4/3]]
這裏A
是Document x Words
一個矩陣,其中A_ij
是字i
的文件j
一個期限,頻率計數。並且b
矢量是針對每個詞預先計算的IDF值,例如如果在7個不同文檔中使用詞j
,則b_j
是1/7。
人們如何稱之爲列式乘法? 有沒有現有的庫支持這個操作? (Python)的
- 由於大尺寸&稀疏的,我已經使用
csr_matrix
在scipy
保存矩陣。 - 我試圖將它們更改爲np.array並執行
A*b
操作,但它在幾分鐘內未完成。
如果我一直使用A和B的scipy矩陣怎麼辦? – SUNDONG