2013-07-18 18 views
7

我正在嘗試編寫一個通用腳本,其中的一部分導入了以逗號分隔或以空格分隔的文件。我希望腳本識別任何類型。是否有指定類似numpy.genfromtxt:不明確的分隔符?

arrayobj = np.genfromtxt(file.txt, delimiter=(',' OR '\t'), names=None, dtype=None) 

我使用正則表達式(',|\t')嘗試,但,不能正常工作的一種方式。

+4

我不相信你可以使用np.genfromtxt這一點。分隔符參數直接傳遞給python標準庫'str.split(delimiter)'。 – Daniel

回答

1

如上所述,我不相信有一種方法可以做到這一點np.genfromtxt;但是你總是可以使用python熊貓。

example.txt: 
1,2,3 #Header 
1,2,3 
4,5'tab'6 
7'tab'8'tab'9 

使用熊貓read_csv

print pd.read_csv('example.csv',sep='\t|,').values 
[[1 2 3] 
[4 5 6] 
[7 8 9]]