我有一些數據(文本文件)以最不均勻的方式格式化,人們可以想到。我試圖最大限度地減少解析這些數據的手動工作量。 樣本數據: Name Degree CLASS CODE EDU Scores
--------------------------------------------------------------------------------------
John Marsha
我想爲EDI數據格式編寫一個解析器,它只是分隔文本,但是在文件頂部定義了分隔符。 本質上它是一堆基於我在代碼頂部讀取的值的splits()。 問題是這也是一個自定義的'轉義字符',表明我需要忽略下面的分隔符。 例如,假設*是分隔符和?是逃避,我正在做類似 use Data::Dumper;
my $delim = "*";
my $escape = "?";
my $edi = "foo*b