我試圖計算所有值之間的餘弦相似度。如何加速在python中使用嵌套循環計算餘弦相似度的時間
1000 * 20000的計算時間花了我10多分鐘。
代碼:
from gensim import matutils
# array_A contains 1,000 TF-IDF values
# array_B contains 20,000 TF-IDF values
for x in array_A:
for y in array_B:
matutils.cossim(x,y)
因此,有必要使用gensim包拿到TF-IDF值和相似度計算。
有人可以給我一些建議和指導,以加快時間?
是否有可能擺脫for循環之一? Cython會加快速度嗎? –