2
我解析大量的複雜文件(主要是CSV文件,但有些不是),我需要將它們結構/解析爲一些標準格式。這不僅涉及行清理數據,而且涉及一些簡單的單個基於單元的邏輯。我想要一個非程序員可以使用的工具,因此業務團隊成員可以編寫簡單的拖放邏輯並且不佔用工程時間。到目前爲止,我看過Google Refine和Data wrangler,最後一張看起來不錯。還有其他的工具嗎?什麼是一些好的數據清理工具?
我解析大量的複雜文件(主要是CSV文件,但有些不是),我需要將它們結構/解析爲一些標準格式。這不僅涉及行清理數據,而且涉及一些簡單的單個基於單元的邏輯。我想要一個非程序員可以使用的工具,因此業務團隊成員可以編寫簡單的拖放邏輯並且不佔用工程時間。到目前爲止,我看過Google Refine和Data wrangler,最後一張看起來不錯。還有其他的工具嗎?什麼是一些好的數據清理工具?
ETL工具面向關係數據庫,但也支持XML和CSV文件輸入/輸出。例子:
可以很容易地爲你的要求太複雜,但。此外,請參閱SO上的這個類似問題(附加鏈接):What software is availible for data quality checking。
上面提到的另一個帶有數據清理功能的ETL工具是[CloverETL](http://www.cloveretl.com) – 2012-02-13 09:09:42