我正在寫一個程序,每行用逗號分隔符分析.txt文件。代碼是用C#編寫的。文件是.txt
,db是mssql。使用差異模式序列處理CSV的最佳方法是什麼?
通常的順序是
date_aired,
time_aired_start,
time_aired_end,
duration_aired,
movie_name but
發現了一些行顯示此序列
date_aired,
time_aired_start,
duration_aired,
movie_name.
這是沒有問題的,因爲我可以只通過持續增加time_aired_start得到time_aired_end但再次發現有另一個這樣的序列
date_aired,
time_aired_start,
date_aired,
time_aired_end,
movie_name
我的意思是某些行在第一種模式下是wiritng,而有些行在第二種模式中,或者在一個txt文件中是第三種。沒有辦法,我能確定我有解析每列使用,並把它放在我的目的是通過指數如下面的代碼代碼:
AirData aData= new AirData();
aData.dateAir = txtParse[0]
aData.timeStart = txtParse[1]
aData.timeEnd = txtParse[2]
aData.duration = txtParse[3] ...etc.
所以我的問題是,什麼是處理這些的最佳途徑情況?文本文件已交給我已經由某臺機器生成,我無法更正它。我的工作是解析它並將其存儲在數據庫中,以便爲其生成報告。
我的想法是把它放在try catch中,每次拋出一個異常,它會嘗試執行第二個模式或第三個,如果拋出另一個異常。這很好嗎?或任何建議?
更新:
一些實際的數據。 這裏的列是從我上面的示例差異我只是快捷方式。
PATTERN 1:11個字段
01/01/2013,
00:00:00;00,
00:00:54;19,
00:00:54:20,
01/01/2013,
00:00:00;00,
00:00:54;19,
00:00:54:20,
Seg 4 HAPPY NEW YEAR WISHES.mp4,
Aired,
5D189F06-886D-40B1-AC70-609C2CA5E774
圖案2:9個字段 - 這可以很容易地發現,因爲我可以只檢查,如果數組的長度更小於11
01/28/2013,
21:38:23;11,
00:01:00:04,
01/28/2013,21:38:23;11,
00:01:00:04,
ADXEFRF2-0243.mov,
Aired,
9E74C08C-8E30-48A1-A743-44ACC93E183E
但這裏的問題我有:
模式3 - 還有11個字段但順序不同。
01/28/2013,
21:39:23;15,
00:08:03:01,
01/28/2013,
21:39:23;15,
01/28/2013,
21:47:26;13,
00:08:03:01,
THE IMPOSTOR With Eng Subs Ep 11-5.mp4,
Aired,
895F4F16-5624-4A2C-A5E0-D3BF1BA57B86
文本文件是否有可動態用於確定列順序的標題? – Kane 2013-04-09 10:58:24
使用異常作爲流量控制被認爲是不好的做法,所以你應該找到另一種方法。 – 2013-04-09 11:01:22
你可以使用某種模式匹配來決定3種格式嗎?你能以這些格式顯示一些實際的數據嗎? – 2013-04-09 11:04:18