1
經過對csv/pandas/etc的一些研究來操作一個巨大的csv文件,我決定使用熊貓來分割我需要的信息。 現在,我只需使用過濾器即「Name」=「Greg」即可獲得我需要的內容,其中只有當列名稱具有Greg時纔會看到行。 但是,我現在想創建一個pyhton列表,包含特定列(即City)的所有信息。我怎麼能這樣做? 然後,我將與清單只是工作進行排序,計算等使用熊貓來分割和創建列表
我有什麼:打印(slice1)的
import pandas as pd
all_data = pd.read_csv(
'myfile.csv', # file name
sep=',', # column separator
quotechar='"', # quoting character
encoding='utf-16',
na_values=0, # fill missing values with 0
usecols=[0,1,3], # columns to use
decimal='.') # symbol for decimals
slice1 = all_data[all_data['Name'] == 'Greg']
print (slice1)
例子:
非常感謝!偉大的投入!看起來像熊貓不喜歡我的城市列的數據格式,因爲它得到一個錯誤說:KeyError:'城市'。任何想法爲什麼? – Gonzalo
也許像''City''這樣的單詞'City'前面有空格?通過print(all_data.columns.tolist())來檢查它。' – jezrael
humm ..我得到:['\ ufeffCity','Name','Country']。不知道這個\ ufeff是什麼:( – Gonzalo