sparse-matrix

    0熱度

    1回答

    我有一個非常大的稀疏矩陣,所以我需要我的問題的一些快速的解決方案: 讓我們A是一些小的稀疏矩陣(只是舉例): > A 4 x 5 sparse Matrix of class "dgCMatrix" A B C D E [1,] 1 1 5 4 6 [2,] 51 2 40 1 5 [3,] 3 40 10 .

    4熱度

    1回答

    我有一個300萬×900萬的稀疏矩陣,有幾十億個非零條目。 R和Python不允許超過MAXINT非零條目的稀疏矩陣,因此我發現自己使用了Julia。 雖然用標準偏差縮放這些數據是微不足道的,但貶低當然是一種天真的方式,因爲這會創建一個密集的200+太字節矩陣。 做SVD相關的代碼朱莉婭可以在https://github.com/JuliaLang/julia/blob/343b7f56fcc84

    1熱度

    1回答

    scikit documentation解釋fit_transform只能用於密集矩陣,但我有一個csr格式的稀疏矩陣,我想執行tsne。該文檔說爲使用稀疏矩陣使用fit方法,但是這不會返回低維嵌入。 我明白我可以使用.todense()方法如this question,但我的數據集非常大(0.4 * 10^6行和0.5 * 10^4列),從而不會配合在存儲器中。真的,使用稀疏矩陣來做這個很好。有

    3熱度

    3回答

    我有一個非常稀疏的結構化矩陣。我的矩陣每列只有一個非零的條目。但其巨大的(10K * 1M),並在下面的形式給出(例如uisng隨機值) rows = np.random.randint(0, 10000, 1000000) values = np.random.randint(0,10,1000000) 中行給我們在每列非零項的行號。我想要S與S進行快速矩陣乘法,我現在正在執行以下操作 -

    0熱度

    1回答

    我有這樣的疏火花數據幀: In [50]: data.show() +---------+-------+---------+-------+-------+--------+ | pid| 111516| 387745|1211811|1857606| 2187005| +---------+-------+---------+-------+-------+--------+ | 6

    0熱度

    1回答

    我正在使用一個連接矩陣來表示圖形數據結構。 NxM矩陣對應於具有M個頂點的N條邊(它可能具有比頂點更多的邊,這就是爲什麼我使用scipy的csr_matrix)。邊緣的「開始」點由「-1」表示,終點在連通性矩陣中由「1」表示。所有其他值都是0,所以每行只有2個非零值。 我需要整合一個「細分」方法,它將有效地更新連接矩陣。目前我正在將連通性矩陣轉換爲稠密矩陣,以便我可以添加新的行/列並更新舊的行。我

    0熱度

    2回答

    假設與字符串列表的列表如下 docs = [["hello", "world", "hello"], ["goodbye", "cruel"]] 一個人如何去創建一個稀疏矩陣,其中每一行代表上述列表中的子列表和每列代表一個像子列表中的「殘忍」的標記字符串。 我看着scipy文檔here和一些其他的stackoverflow帖子,但是,這一個是不清楚給我。 row_idx = 0

    0熱度

    1回答

    A=sc.array([[0,2,1],[2,0,3],[1,3,0]]) sA = sp.csc_matrix(A) Q2=np.exp(A) print Q2 Q1=sp.linalg.expm(sA) print (Q1) 我與大數據集的鄰接矩陣,我需要做的指數矩陣的工作指數(我用的是中信建投稀疏矩陣表示)。我是用玩具數據集像上面的錯誤測試並發現scipy.sparse.li

    4熱度

    1回答

    我訓練使用xgboost庫中由sparse.model.matrix產生的矩陣R的簡單模型不同,那麼我做了兩個驗證數據集的預測 - 通過創建一個sparse.model.matrix從Matrix和從stats第二個由model.matrix。令我驚喜的結果差異很大。稀疏矩陣和稠密矩陣具有相同的維度,所有數據都是數字,並且沒有缺失值。 在這兩套 平均預測如下: 密集驗證矩陣:0.5009256 稀

    2熱度

    1回答

    我有線性系統來解決這個問題,它由大型稀疏矩陣組成。 我一直在使用scipy.sparse庫和它的linalg子庫來做到這一點,但我不能讓一些線性求解器工作。 這裏是一個工作例子再現問題對我來說: from numpy.random import random from scipy.sparse import csc_matrix from scipy.sparse.linalg import