2017-07-21 102 views
0

我有一個字典的Python字典,它模擬了一組文檔中單詞的TF-IDF權重。這樣的:將字典轉換成熊貓DataFrame

Corpus_dict = { 「Doc1.txt」:{ '字1':XXXX, '單詞2':XXXX,...,wordn:XXX} 「Doc2.txt」:{ '字1':XXXX ,'word2':XXXX,...,wordn:xxx}
... 「Docm.txt」:{'word1':XXXX,'word2':XXXX,...,wordn:xxx}}

其中xxx是n個單詞中每一個單詞的TF-IDF值。我想將其轉換爲如下因素大熊貓數據幀:

keys  Doc1  Doc2 ... Docn 

word1  xxx  xxx   xxx 
word2  xxx  xxx   xxx 
         ... 
word  nxxx  xxx   xxx 

有人可以給我一些幫助?

對不起,因爲糟糕的英語和謝謝!

+1

的[創建從字典字典大熊貓數據幀(https://stackoverflow.com/questions/33157522/create-pandas-dataframe-from-dictionary-of-dictionaries) –

回答

2

只需使用

pd.DataFrame(Corpus_dict) 

它會給你想要的數據幀。

發現了類似的問題here

+0

工作得很好可能的複製。謝謝! – yuridamata

0

你的問題的答案是應該像下面的圖片。

enter image description here