2016-11-30 30 views
-1

我是python的新手,如果您儘快給我一個答案,我將不勝感激。在不知道列數的情況下在熊貓數據框中添加一行

我正在處理一個文件,其中包含可能屬於多個類別的產品的評論。我需要的是按類別對評論評分進行分組,並同時進行日期。由於我不知道類別或日期的確切數量,因此我需要在處理評論數據(50 GB文件)時添加行和列。

我已經看到了如何添加列,但是我的問題是添加一行而不知道數據框中當前有多少列。

這裏是我的代碼:

list1=['Movies & TV', 'Books'] #categories so far 
    dfMain=pandas.DataFrame(index=list1,columns=['2002-09']) #only one column at the beginnig 
    print(dfMain) 

這是dfMain樣子:

enter image description here

如果我想增加一列,我只是這樣做: dfMain.insert( 0,date,0)#其中的日期格式類似於'2002-09'

但是如果我想添加一個新的類別(行)並填寫所有的日期(列)用零?我怎麼做?我嘗試了方法追加,但它要求所有的列作爲參數。方法Insert似乎沒有任何工作..

+0

人提示:敦促應答者只會加速downvotes。 –

+0

添加一行:'df.loc ['newrow'] = None' – burhan

+0

@burhan它的工作原理,謝謝! – Claire

回答

0

這裏是一個可能的解決方案:

dfMain.append(pd.Series(index=dfMain.columns, name='NewRow').fillna(0)) 

      2002-09 
Movies & TV NaN 
Books  NaN 
NewRow  0.0 
相關問題