2016-12-06 131 views
0

我有一個Jupyter Python筆記本,其數據矩陣與 中的某些字出現在SFrame文檔中。列名 是['great','bad',....],並且每行在列表的不同行上出現 的數量(對不起,我無法從VM獲取 截圖)。因此,行值都是非負整數 0,1,2,...在Jupyter筆記本中創建矩陣

我想創建一個矩陣2列11行rows.Each有兩個項目:一個 包含每個字的名字另一個條目包含單詞的總數(對固定列的所有行進行總和)。這些詞是名爲「選定詞」的列表的一部分。我有點笨, 我知道如何爲現有的SFrame創建新的列,但不知道如何創建新的SFrame或其他Python數據結構。我最好的是:

for word in selected_words: 
    count[word]=products[word].sum() 
    print [word, count[word]] 

我也想過創建一個其他文件格式的矩陣和導入它。但後來我不知道如何

任何想法? 謝謝。

+0

你必須使用SFrame嗎?熊貓可能更容易 – maxymoo

回答

0

我發現的最簡單的方法是創建一個Python字典。

'selected_words'是您的單詞的Python列表,因此只需遍歷每個單詞並使用每個關鍵詞和出現次數來構建詞典。

totals = {} 
for word in selected_words: 
    totals[word] = products[word].sum() 

然後,你可以輸入IPython的totals,它會給你每個單詞的字典,它的數量。