set_value和= pandas之間有什麼區別

在寫入pandas的數據框時，我們看到我們有幾種方法來完成它，如this answer和this answer所提供的。set_value和= pandas之間有什麼區別

我們的

df[r][c].set_value(r,c,some_value)方法和
df.iloc[r][c] = some_value的方法。

有什麼區別？哪個更快？要麼是副本？

來源

2017-04-26 user2723494

每自己貼的答案，它看起來就像是速度的問題。 – pshep123

所不同的是set_value是返回一個對象，而賦值操作符分配值到現有DataFrame對象。

調用set_value後，你將可能有2個DataFrame對象（這並不一定意味着你將有兩個數據副本，DataFrame對象可以「參照」彼此），而賦值運算符將改變數據單個DataFrame對象。

這似乎是更快地使用的set_value，因爲它可能是對於用例進行了優化，而分配的方法將生成的數據的中間切片：

In [1]: import pandas as pd 

In [2]: import numpy as np 

In [3]: df=pd.DataFrame(np.random.rand(100,100)) 

In [4]: %timeit df[10][10]=7 
The slowest run took 6.43 times longer than the fastest. This could mean that an intermediate result is being cached 
10000 loops, best of 3: 89.5 µs per loop 

In [5]: %timeit df.set_value(10,10,11) 
The slowest run took 10.89 times longer than the fastest. This could mean that an intermediate result is being cached 
100000 loops, best of 3: 3.94 µs per loop

的set_value結果可能在這個是一個副本，但documentation是不是真的清楚（我）：

返回：

幀：數據幀

如果標籤對包含，將參考調用數據幀，否則一個新的對象

來源

2017-04-27 07:54:55 NirIzr

set_value和= pandas之間有什麼區別

回答

相關問題