我有一個像這樣的熊貓數據框。如何爲每個術語保留k個最相似的術語記錄並用0替換不太相似的術語
這是一個逐項相似matrix.For通過長期的相似矩陣NxN的名詞,我想保持K記錄是每個術語最相似期限的記錄,更換NK其餘少與0相似的記錄。對於這個玩具的例子,我想得到一個數據框如
如果k = 2。
frame=pd.DataFrame(data=np.array([[1,0.5,3,0.3],[0.5,1,0.3,0.4],[3,0.3,1,0.7],[0.3,0.4,0.7,1]]),columns=['w1','w2','w3','w4'])
frame.index=['w1','w2','w3','w4']
您能否告訴我如何在應用大矩陣時用熊貓編碼此功能。