我有兩個目錄,我想讀他們的文本文件和標籤,但我不知道如何通過TaggedDocument做到這一點,我認爲它會作爲TaggedDocument([字符串],[標籤]),但這doesn顯然工作。這是我的代碼: from gensim import models
from gensim.models.doc2vec import TaggedDocument
import utilities as
我已生成使用gensim一個巨大的語料庫word2vec模型矩陣,我需要使用k以羣集詞彙均值聚類用於我需要: 餘弦距離矩陣(到詞,所以矩陣的大小的number_of_words X number_of_words) 設有矩陣(字特徵,所以矩陣的大小是number_of_words X number_of_features(200)) 爲特徵矩陣我試圖給我們ex = model.wv,我得到的對象類