2012-05-21 69 views
1

我有一堆.cif文件,總計大約33Mb,包含關於本地總線及其時間表的信息。每一行都以不同的標識符開始,以指示該行的全部內容。解析ATCO CIF文件以生成CSV或XML輸出

示例行:

QSN319 020S3_20110104219912311111100 S3 LFBUS O

表示這是一個公交車行程信息,一些不同日期和星期S3運行在公交車的日子。你可以看一下更詳細的例子http://pastebin.com/3jzp6QL9

我需要做的就是以某種方式解析所有(或部分選擇,例如我不需要在我的數據庫QSN一部分)進行進一步的數據到CSV或XML SQLite導入。我只需要一個正確的方向和一些我可以使用的工具。 awk和sed是否足以做到這一點,或者我是否更願意從頭開始編寫解析器。

任何意見或建議將不勝感激!

+0

整個星期沒有一條評論?我需要這個東西的手:) – platforma

回答

0

我與David J. Rice的ATCO-CIF parser取得了相當不錯的成功。它是用Ruby編寫的。