我有一種形式的數據,類別和值位於由「;」分隔的同一行中。如下所示:如何使用動態列數重新格式化數據
{{category1;value}, {category2;value}, {category3;value} ....}}
在每一行的數據是這樣的,可能有不同數量的類別。所以,第一行可能有category1到category5,而第二行可能有category1到category10。類別總是按順序排列。
我需要解析數據並創建一個新文件,以便我有列標題中的類別名稱和相應行中的值。
category1 category2 category3 category4 ....
value value value value
但是由於我不能說可能有多少類別,所以我需要添加每個新列。所以,解析第一行我會知道有5列(cat1到cat5),但對於第二行,我必須將cat6的列添加到cat10等等。
任何想法如何做到這一點。任何Linux bash腳本都可以,但python比我更可取。
類別或值可以包含括號? – unutbu
@unutbu值可以有任何字符。但類別周圍有大括號;值對也如圖所示。 – sfactor
如果'value'可以包含任何字符,那麼應該使用什麼規則來確定「{{category1; value},{category2; value}}」沒有被分析爲具有一個類別「category1」,值爲value },{category2; value'? – unutbu