7
我正在嘗試編寫一個通用腳本,其中的一部分導入了以逗號分隔或以空格分隔的文件。我希望腳本識別任何類型。是否有指定類似numpy.genfromtxt:不明確的分隔符?
arrayobj = np.genfromtxt(file.txt, delimiter=(',' OR '\t'), names=None, dtype=None)
我使用正則表達式(',|\t'
)嘗試,但,不能正常工作的一種方式。
我正在嘗試編寫一個通用腳本,其中的一部分導入了以逗號分隔或以空格分隔的文件。我希望腳本識別任何類型。是否有指定類似numpy.genfromtxt:不明確的分隔符?
arrayobj = np.genfromtxt(file.txt, delimiter=(',' OR '\t'), names=None, dtype=None)
我使用正則表達式(',|\t'
)嘗試,但,不能正常工作的一種方式。
如上所述,我不相信有一種方法可以做到這一點np.genfromtxt
;但是你總是可以使用python熊貓。
example.txt:
1,2,3 #Header
1,2,3
4,5'tab'6
7'tab'8'tab'9
使用熊貓read_csv
:
print pd.read_csv('example.csv',sep='\t|,').values
[[1 2 3]
[4 5 6]
[7 8 9]]
我不相信你可以使用np.genfromtxt這一點。分隔符參數直接傳遞給python標準庫'str.split(delimiter)'。 – Daniel