Python初學者在這裏。我正在使用matplotlib庫從製表符分隔的文本文件製作圖形。我希望我的腳本具有靈活性,以便它可以採用不同類型的數據文件並將它們轉換爲圖形。我遇到的關鍵問題是不同的文本文件在數據開始之前具有不同數量的標題行。我希望有一種方法可以讓Python找出頭部有多少行,然後刪除它們。如何使用Python去除未知長度的標題
我認爲這可能通過兩種方式來完成:
1)計數每行的列/元素在文件中最經常存在的數量,因爲大部分線路將包含感興趣的數據列。然後使用for循環,刪除所有不包含此列數的行。
2)統計文件最後一行的列數/元素數,然後刪除任何不符合此長度的行。正如所有使用最後一行的文件也是數據一樣,這也是可行的。
如果任何人都可以告訴我一個簡短的方法來做到這一點在python中集成到我的腳本,真的會有很大的幫助。
非常感謝,
Rubal
這聽起來像一個合理的想法。你有什麼嘗試? – 2012-03-01 17:58:04
嗨,我還應該補充一點,在完成這個之後,我會另外刪除第一個剩餘行包裝,其中有一個標題的數據高於數據(這通常是我的數據)。我與大型基因組數據集一起工作,因此丟失一行數據是可以的。 – user964689 2012-03-01 18:52:03
恐怕我還沒有嘗試過任何東西,除了設置for循環之外:對於輸入文件中的行:#iterate輸入文件中的每一行 \t line = line.rstrip() \t fields = line.split(「 \ t「) – user964689 2012-03-01 18:52:45