0
我期待深入瞭解我的數據。我使用sklearn PCA將它們轉換成VSM,並將它們繪製成matplotlib圖形。這涉及繪製新文檔以繪製散點圖
使用管道
test = pipeline.fit_transform(docs).todense()
件到我的模型鑄造的文件的數量矩陣
pca = PCA().fit(test)
然後我使用變換
將其轉換data = pca.transform(test)
個
最後我用繪製Matplotlib
plt.scatter(data[:,0], data[:,1], c = categories)
我的問題,結果是這樣的:我如何採取新的句子,並確定他們將在於相對於其他文件繪製。用X標記他們的相對位置?
感謝