2013-05-28 151 views
0

我已成功安裝Cloudera Hadoop/HBase集羣的OpenTSDB ontop。將csv數據導入OpenTSDB

我的問題是,我有歷史1分鐘股票數據的裏姆斯,看起來像這樣:

"Date","Time","Open","High","Low","Close","Volume" 
12/30/2002,0930,24.53,24.65,24.53,24.65,762200 
12/30/2002,0931,24.65,24.68,24.52,24.6,90400 

.....

從QS指南中的文檔,它說,在批量導入部分:當我嘗試這對我的數據,它拋出一個異常無益

./tsdb導入文件

有關如何將其導入OpenTSDB的任何提示?謝謝。

回答

4

您需要編寫一個腳本來將您的CSV文件轉換爲OpenTSDB格式的文件。對於OpenTSDB的一般格式爲metric timestamp value tags

爲例說明如下您的樣品可以寫成:

stock.open 1041269400 24.53 symbol=XXX 
stock.high 1041269400 24.65 symbol=XXX 
stock.low 1041269400 24.53 symbol=XXX 
stock.close 1041269400 24.65 symbol=XXX 
stock.volume 1041269400 762200 symbol=XXX 
stock.open 1041269460 24.65 symbol=XXX 
stock.high 1041269460 24.68 symbol=XXX 
stock.low 1041269460 24.52 symbol=XXX 
stock.close 1041269460 24.6 symbol=XXX 
stock.volume 1041269460 90400 symbol=XXX 

雖然因爲它似乎你與1分鐘的時間工作,開/關是多餘的,所以也許這會更合適:

stock.quote.1m 1041269340 24.53 symbol=XXX 
stock.quote.1m 1041269400 24.65 symbol=XXX 
stock.quote.1m 1041269460 24.6 symbol=XXX