我基本上是從R遷移到Python。我想基於列來對數據框進行子集化。當遇到堆棧溢出answer時,我找到了一個解決方案。熊貓數據框中.loc的用途
但考慮下面的代碼:
import pandas as pd
import numpy as np
df = pd.DataFrame({'A': 'foo bar foo bar foo bar foo foo'.split(),
'B': 'one one two three two two one three'.split(),
'C': np.arange(8), 'D': np.arange(8) * 2})
df1 = df[df['A'] == "foo"]
df1
df2 = df.loc[df['A'] == "foo"]
df2
兩個DF1和DF2是一樣的。
所以我的問題是:首先要求loc
功能是什麼。請記住,我來自R背景和R,我們不必使用loc
類型函數來對數據幀進行子集化。
請閱讀[本](http://pandas.pydata.org/pandas-docs/stable/indexing.html#different-choices-for-indexing)和[this](http://pandas.pydata。 org/pandas-docs/stable/indexing.html#indexing-view-versus-copy)如果您還有其他問題,請編輯您的問題 – EdChum