1
我有一個文件(示例如下所示),它具有多個CSV表格。這個文件被上傳到數據庫。我想對這個文件做一些操作。爲此,我正在考慮使用pandas使用read_csv函數將每個表讀入單獨的數據框。但是,通過文檔,我沒有看到一個選項來指定要讀取/解析的行的子集。這可能嗎?如果不是,還有其他的選擇嗎?熊貓:read_csv(讀取單個文件中的多個表格)
示例文件:
TABLE_1
col1,col2
val1,val2
val3,val4
TABLE_2
col1,col2,col3,col4
val1,val2,val3,val4
...
...
我可以通過文件執行初始通來確定每個表的開始/結束線。但是,read_csv參數之一是「filepath_or_buffer」,但我並不完全確定'buffer'部分是什麼。它是一個字符串或一個大字符串或其他東西的列表?我可以使用什麼緩衝區?有人可以指出一個使用read_csv和緩衝區的小例子嗎?感謝您的任何想法。
它可以讀取該類型與'read.csv'使用'skip'和'nrow'參數文件。第一步是運行'readLines'並找出表格之間的差距。如果存在一致性,則有助於 –