將多個字符串數組轉換爲矩陣的pythonic方式是什麼,其中每個輸入字符串根據字典順序在新矩陣中獲得位置(或者甚至有一個更好的標準?)。最後,我希望能夠根據標準化的通用標準查詢最終的矩陣字符串,並且能夠找出每個特定字符串最初來自哪個輸入數組。如何使用python將字符串數組轉換爲矩陣
因此,舉例來說,如果我遍歷像這樣一堆陣列(僞!):
array1 = {'01abc','aabc','cba','xyz','999','zz','ZZ'}
array2 = {'0c','aabc','cc','xz','aZZ'}
array3+n = {'...','...','...','....
我想改變它弄成這個樣子:
name 0 9 a c x z Z
array1 01abc 999 aabc cba xyz zz ZZ
array2 0c aabc cc xz
array2 aZZ
array3...
我已經嘗試了2個小時尋找我的方式,但我只是沒有正確的術語來恰當地描述我的問題......任何可以將我指向正確方向的想法都將不勝感激。
我無法理解你想要的東西 - 你能也許解釋一點關於這個問題的背景是什麼? –
我正在嘗試找到一種方法將具有相似內容的數組羣集起來。在上面的例子中,array1和array2是相似的,因爲它們都包含字符串「aabc」。我想過使用一個矩陣來加速聚類,因爲將會有大約50.000個數組被處理。我知道像Mahout這樣的軟件等類似的任務...因爲我的問題有點不符合標準,我更喜歡直接python實現 – Jabb
這聽起來像你想把字符串放入「箱」基於他們的第一個字母,同時還要記住每個字符串最初來自哪個數組。數據結構是否必須是矩陣?在我看來,另一種結構會更好... – senderle