列表對於給定的dataframe
獲得一個或多個列中的值從熊貓數據框中
Bin1 Bin2 Bin3
0 A 1 7
1 B 2 8
2 C 3 9
我想從Bin1
和Bin3
列
我試過值的列表,
df[["Bin1","Bin3"]].values.tolist()
但它沒有給出預期的列表。
我期望的輸出,
output_df = ["A","B","C",7,8,9]
列表對於給定的dataframe
獲得一個或多個列中的值從熊貓數據框中
Bin1 Bin2 Bin3
0 A 1 7
1 B 2 8
2 C 3 9
我想從Bin1
和Bin3
列
我試過值的列表,
df[["Bin1","Bin3"]].values.tolist()
但它沒有給出預期的列表。
我期望的輸出,
output_df = ["A","B","C",7,8,9]
建立列表的列表,然後flatten:
l = df[["Bin1","Bin3"]].values.T.tolist()
flat_list = [item for sublist in l for item in sublist]
print (flat_list)
['A', 'B', 'C', 7, 8, 9]
類似,由於Bharath shetty:
flat_list = df[["Bin1","Bin2"]].values.T.flatten().tolist()
在這裏你去:
df['Bin1'].tolist() + df['Bin3'].tolist()
['A', 'B', 'C', 7, 8, 9]
一樣簡單:list(df[["Bin1","Bin2"]].as_matrix().flatten())
很少有其他方式
選項1unstack
In [1413]: df[['Bin1', 'Bin3']].unstack().values.tolist()
Out[1413]: ['A', 'B', 'C', 7L, 8L, 9L]
選項2ravel
In [1426]: df[['Bin1', 'Bin3']].values.ravel(order='A')
Out[1426]: array(['A', 'B', 'C', 7L, 8L, 9L], dtype=object)
個
計時
In [1446]: df.shape
Out[1446]: (60000, 3)
In [1447]: %timeit df['Bin1'].values.tolist() + df['Bin3'].values.tolist()
100 loops, best of 3: 2.95 ms per loop
In [1440]: %timeit df['Bin1'].tolist() + df['Bin3'].tolist()
100 loops, best of 3: 4.87 ms per loop
In [1442]: %timeit df[['Bin1', 'Bin3']].values.ravel(order='A').tolist()
100 loops, best of 3: 5.86 ms per loop
In [1443]: %timeit df[['Bin1', 'Bin3']].unstack().values.tolist()
100 loops, best of 3: 9.32 ms per loop
In [1444]: %timeit df[["Bin1","Bin2"]].values.T.flatten().tolist()
100 loops, best of 3: 6.91 ms per loop
In [1445]: %timeit [it for subl in df[["Bin1","Bin3"]].values.T.tolist() for it in subl]
10 loops, best of 3: 20.3 ms per loop
通過使用melt
df[['Bin1','Bin3']].melt().value.tolist()
Out[382]: ['A', 'B', 'C', 7, 8, 9]
'DF [[ 「斌」, 「斌2」]]。values.flatten()。tolist()'? – Dark