使用可變

我試圖理解這兩個語句使用可變

dataframe['newColumn'] = 'stringconst'

和

for x in y: 
    if x=="value": 
     csv = pd.read_csv(StringIO(table), header=None, names=None) 
     dataframe['newColumn'] = csv[0]

在第一種情況下，大熊貓之間的區別添加在大熊貓列填充所有常數值的行，但在第二種情況下，它僅填充第一行並將NaN分配給其餘行。爲什麼是這樣？如何將第二種情況下的值分配給數據框中的所有行？

來源

2017-09-20 Fox

因爲csv[0]是不是標量值。這是一個pd.Series，當您使用pd.Series進行賦值時，它嘗試按索引（整點pandas）進行對齊，並且除第一行之外的其他位置可能會得到NAN，因爲只有第一行的索引與pd.DataFrame索引對齊。因此，考慮兩個數據幀（注意，他們是除了指數，它是由20移份）：

>>> df 
    0 1 2 3 4 
0 4 -5 -1 0 3 
1 -2 -2 1 3 4 
2 1 2 4 4 -4 
3 -5 2 -3 -5 1 
4 -5 -3 1 1 -1 
5 -4 0 4 -3 -4 
6 -2 -5 -3 1 0 
7 4 0 0 -4 -4 
8 -4 4 -2 -5 4 
9 1 -2 4 3 0 
>>> df2 
    0 1 2 3 4 
20 4 -5 -1 0 3 
21 -2 -2 1 3 4 
22 1 2 4 4 -4 
23 -5 2 -3 -5 1 
24 -5 -3 1 1 -1 
25 -4 0 4 -3 -4 
26 -2 -5 -3 1 0 
27 4 0 0 -4 -4 
28 -4 4 -2 -5 4 
29 1 -2 4 3 0 
>>> df['new'] = df[1] 
>>> df 
    0 1 2 3 4 new 
0 4 -5 -1 0 3 -5 
1 -2 -2 1 3 4 -2 
2 1 2 4 4 -4 2 
3 -5 2 -3 -5 1 2 
4 -5 -3 1 1 -1 -3 
5 -4 0 4 -3 -4 0 
6 -2 -5 -3 1 0 -5 
7 4 0 0 -4 -4 0 
8 -4 4 -2 -5 4 4 
9 1 -2 4 3 0 -2 
>>> df['new2'] = df2[1] 
>>> df 
    0 1 2 3 4 new new2 
0 4 -5 -1 0 3 -5 NaN 
1 -2 -2 1 3 4 -2 NaN 
2 1 2 4 4 -4 2 NaN 
3 -5 2 -3 -5 1 2 NaN 
4 -5 -3 1 1 -1 -3 NaN 
5 -4 0 4 -3 -4 0 NaN 
6 -2 -5 -3 1 0 -5 NaN 
7 4 0 0 -4 -4 0 NaN 
8 -4 4 -2 -5 4 4 NaN 
9 1 -2 4 3 0 -2 NaN

所以，有一兩件事可以做，以分配整列是簡單地分配在值：

>>> df 
    0 1 2 3 4 new new2 
0 4 -5 -1 0 3 -5 NaN 
1 -2 -2 1 3 4 -2 NaN 
2 1 2 4 4 -4 2 NaN 
3 -5 2 -3 -5 1 2 NaN 
4 -5 -3 1 1 -1 -3 NaN 
5 -4 0 4 -3 -4 0 NaN 
6 -2 -5 -3 1 0 -5 NaN 
7 4 0 0 -4 -4 0 NaN 
8 -4 4 -2 -5 4 4 NaN 
9 1 -2 4 3 0 -2 NaN 
>>> df['new2'] = df2[1].values 
>>> df 
    0 1 2 3 4 new new2 
0 4 -5 -1 0 3 -5 -5 
1 -2 -2 1 3 4 -2 -2 
2 1 2 4 4 -4 2  2 
3 -5 2 -3 -5 1 2  2 
4 -5 -3 1 1 -1 -3 -3 
5 -4 0 4 -3 -4 0  0 
6 -2 -5 -3 1 0 -5 -5 
7 4 0 0 -4 -4 0  0 
8 -4 4 -2 -5 4 4  4 
9 1 -2 4 3 0 -2 -2

或者，如果你想在第一列分配的第一個值，然後實際選擇使用iloc或其他selecto的第一個值 r and then do assignment：

>>> df 0 1 2 3 4 new new2 0 4 -5 -1 0 3 -5 -5 1 -2 -2 1 3 4 -2 -2 2 1 2 4 4 -4 2 2 3 -5 2 -3 -5 1 2 2 4 -5 -3 1 1 -1 -3 -3 5 -4 0 4 -3 -4 0 0 6 -2 -5 -3 1 0 -5 -5 7 4 0 0 -4 -4 0 0 8 -4 4 -2 -5 4 4 4 9 1 -2 4 3 0 -2 -2 >>> df['newest'] = df2.iloc[0,0] >>> df 0 1 2 3 4 new new2 newest 0 4 -5 -1 0 3 -5 -5 4 1 -2 -2 1 3 4 -2 -2 4 2 1 2 4 4 -4 2 2 4 3 -5 2 -3 -5 1 2 2 4 4 -5 -3 1 1 -1 -3 -3 4 5 -4 0 4 -3 -4 0 0 4 6 -2 -5 -3 1 0 -5 -5 4 7 4 0 0 -4 -4 0 0 4 8 -4 4 -2 -5 4 4 4 4 9 1 -2 4 3 0 -2 -2 4

來源

2017-09-20 18:21:43

回答

相關問題