如何通過將最後一列指定爲元組的第二個值來從csv文件讀入？

我有三列在一個CSV文件，這樣，每一行的格式爲：如何通過將最後一列指定爲元組的第二個值來從csv文件讀入？

「ABCDEF」「UVWXYZ」 0

我要生成一個元組列表，其中元組的第一個元素是從前兩列中提取的某些特徵的字典，而第二個元素僅僅是代表特徵標籤的第三列（0或1值）。

我嘗試以下，但它拋出一些語法錯誤說我是在最後一行未定義：

dataframe = pd.read_csv(csv_file, header = None, delimiter = "\t") 
a = dataframe[0] 
b = dataframe[1] 
label = dataframe[2] 
feature = [(findFeature(x,y), labels) for x,y in i for i, labels in zip(zip(a,b), label)]

我在哪裏錯了？

來源

2017-06-19 Saurav--

看來你需要：

feature = [(findFeature(x,y), label) for x,y, label in zip(a,b,label)]

來源

2017-06-19 07:49:33 jezrael

我在使用拉鍊壞的（）！ –

-1

我猜你需要改變這個("abcdef", "uvwxyz", 0)到("abcdef", 0, "uvwxyz")：

with open(csv_file, "r") as f: 
    dataframe = [(a,c,b) for a,b,c in map(lambda x: x.split("\t"), f)]

拆包分割每行何時重新包裝，以(a,c,b)

來源

2017-06-19 07:36:29 Netwave

，如果你不需要任何進一步的轉變元組a,b,c您可以使用csv庫而不是pandas：

import csv 
with open(csv_file) as f: 
    reader = csv.reader(f) 
    feature = [(findFeature(x,y), z) for x,y,z in reader]

你可以找到和實例csv包使用here

來源

2017-06-19 07:42:11 Dimgold

如何通過將最後一列指定爲元組的第二個值來從csv文件讀入？

回答

相關問題