如何通過使用Pandas比較hdf5文件中的兩列來選擇某些行? hdf5文件太大而無法加載到內存中。例如,我想選擇列A和列B相等的行。數據框保存在文件'mydata.hdf5'中。謝謝。通過使用HDFStore比較列來選擇行
import pandas as pd
store = pd.HDFstore('mydata.hdf5')
df = store.select('mydf',where='A=B')
這是行不通的。我知道store.select('mydf',where ='A == 12')會起作用。但是,我想比較列A和B的示例數據如下:
A B C
1 1 3
1 2 4
. . .
2 2 5
1 3 3
這是一個錯字:'df = store.select('mydf',where ='A = B')'?不應該是:'df = store.select('mydf',where ='A == B')'即2'=='s? – EdChum 2014-12-08 09:17:33
@EdChum,感謝您的快速回復。但'A = B'和'A == B'都可以。錯誤如下: c:\ python33 \ lib \ site-packages \ pandas \ computing \ pytables.py in convert_value(self,v) 184返回TermValue(int(v),v,kind) 185 elif kind == u('integer'): - > 186 v = int(float(v)) 187 return TermValue(v,v,kind) 188 elif kind == u('float'): ValueError:無法將字符串轉換爲float:'chr_b' – Lee 2014-12-08 09:27:35