1
我正在嘗試導入一個非常大的數據文件。它是一個像在表格中間過濾掉額外的標題
***** Information about Data ***********
Information about data
Information about Data
Information about Data
Information about Data
Col1 Col2
1.0 1.0
1.0 1.0
1.0 1.0
1.0 1.0
...(10k+ lines)
1.0 1.0
1.0 1.0
***** Information about Data ***********
Information about data
Information about Data
Information about Data
Information about Data
Col1 Col2
1.0 1.0
1.0 1.0
1.0 1.0
1.0 1.0
...(10k+ lines)
1.0 1.0
1.0 1.0
並重復一些任意次數的文本文件。標題之間的行數變化,總文件大於100萬行。
有沒有一種方法剝離此標題而不逐行?我已經寫了一行一行的搜索,但這太慢而不實際。
每次顯示時,標題都會略有不同。
是'頭info'實際上'頭info'? – piRSquared
不,我會編輯 – Davidallen353
'np.genfromtxt'從任何可以逐行輸入的東西接受輸入。由於它已經用'readline'讀取了一個文件,因此在流水線中插入逐行搜索不會減慢搜索速度。有了「熊貓」編譯閱讀器,這可能是一個不同的故事。 – hpaulj