我從sklearn袋式矢量化器中有一個稀疏矩陣。它是一個csr_matrix,其元素表示文檔中的詞頻。但現在我需要的是0/1矩陣,其中1代表文檔中存在的單詞,所以我不關心實際的頻率。 忽略的背景問題,是這樣的: 我有一個稀疏矩陣,如何將一個整數值稀疏矩陣轉換爲0/1值稀疏矩陣,Python
2 3 4 0 0 0
0 0 0 0 0 8
0 0 0 2 0 0
0 0 0 0 0 0
我希望所有的非零元素爲1,
1 1 1 0 0 0
0 0 0 0 0 1
0 0 0 1 0 0
0 0 0 0 0 0
我怎樣才能做到這一點?我假設使用todense(),然後循環不是一個好的選擇,因爲稀疏矩陣很大。有沒有更好的辦法?
謝謝!它的工作 –