我正在研究一些集成了幾十個csv文件信息的C++代碼。它們都包含一些我想要提取的時間戳記錄數據,但是每個文件中的表示方式有所不同。表示之間的差異超出了不同的列順序和列名 - 例如,一個文件中的多列一行可能是不同文件中的多行。聚合異構表格數據的設計模式
因此,我需要對每個文件進行一些自定義處理,以便將所有文件中包含必要信息的統一數據結構放在一起。我的問題是,是否有首選的代碼模式來保持複雜性的可管理性和代碼的優雅性?或者,如果有一個很好的案例研究,我應該檢查一下過去是如何處理這種複雜性的。我認爲像perl這樣的腳本語言可能會更容易一些,但是現在這個項目是用C++編寫的,而且我的問題更多的是關於是否有代碼模式來處理這個問題 - 所以答案不會不必太具體語言。)
您可能想要對您的數據進行某種查看... – ltjax 2013-03-19 15:25:41
從根本上看,所有源數據大致相同,即使表示方式不同嗎?你知道在打開格式化的文件之前,還是必須先閱讀標題行? – 2013-03-19 16:14:40
我知道apriori的格式,雖然沒有簡單的方法以編程方式從頭文件中推斷出結構(用於列命名和日期格式的約定是不同的,並且在某些情況下甚至行/列結構在文件之間也是不同的例如提到)。 – daj 2013-03-19 16:58:33