我們有小的hadoop和Greenplum集羣。
當前數據流水線流程是:關鍵HDB - 如何從HAWQ推送數據內部/外部可讀表格到Greenplum
External table >> hadoop-hawq external readbale table >>hawq internal table.
輸出: 1.我們試圖使用延伸Greenplum的數據管道。基本上可以將HAWQ內部表或外部可讀表數據直接推入greenplum。 原因是因爲我們想編輯我們的文件。另外,HAWQ不支持更新和刪除。是否有任何替代方法來處理或推送數據。請指導。
2.How通過GPDB外部表訪問HDFS數據與gphdfs協議
先謝謝了!