每當我輸入任何記錄時,我想爲我的配置單元添加一個唯一值,該值不應該在整個配置單元表中重複使用。我無法找到任何解決方案或任何功能。在我的情況下,我想要使用拉丁語pig輸入蜂巢中的記錄。請幫忙。在配置單元表中添加唯一值
回答
HIVE不提供類似約束的RDBMS數據庫。
使用PIG腳本的建議使用方法如下。 1.加載數據 2.對數據應用DISTINCT 3.將數據存儲在某個位置 4.在相同位置創建外部配置單元表。
如果您可以使用HCATALOG,允許您將數據直接存儲在Hive表中,則步驟3和4可以結合使用。
可以請你分享鏈接嗎? – animal
[1]:https://pig.apache.org/docs/r0.7.0/piglatin_ref2.html#DISTINCT [2]:https://hive.apache.org/javadocs/hcat-r0.5.0/loadstore .html –
它如何適用於OP請求? –
你看看這個? https://github.com/manojkumarvohra/hive-hilo它似乎提供了一種方法來使用hi/lo算法在配置單元中生成序列號
你能提供任何例子嗎?這會幫助我更好地理解它。 – animal
- 1. 在配置單元中添加列後顯示NULL值
- 2. 在配置單元中加入一個udf中的兩個表
- 3. 在C#中一個單元格添加多個值在C#表
- 4. 向另一個列表中的列表添加唯一元素
- 5. 在Excel中添加唯一編號以複製單元格
- 6. 從表格單元格中添加值
- 7. 在菜單項列表中添加一個唯一的標識
- 8. 配置單元添加JAR不工作
- 9. 如何複製搜索表單元素並添加唯一ID
- 10. 將唯一的XML元素值添加到選擇列表
- 11. JSON添加唯一鍵值
- 12. 僅添加唯一值
- 13. 設置在表中的唯一值
- 14. 在Python中添加唯一值到列表中
- 15. 如何在列表中添加新的唯一元素
- 16. 加入兩個表並在配置單元中的新表中插入值
- 17. 在java中的單個鏈接列表中追加唯一值
- 18. 使用兩個配置單元表中的值創建一個新的配置單元表
- 19. 多個表加入配置單元
- 20. 如果另一個單元格匹配,合併唯一值
- 21. 如何將唯一ID添加到自定義單元格中?
- 22. 如何將列添加到現有配置單元外部表?
- 23. 將分區添加到不帶數據的配置單元表
- 24. 使用級聯關鍵字添加列到配置單元表
- 25. 使用Sqoop將數據添加到配置單元表
- 26. MYSQL:基於唯一的行值爲表添加唯一的數值?
- 27. 添加表單元素的值
- 28. 在配置單元中僅獲取一行中的非空值
- 29. 如何在配置單元中加入不同的值
- 30. 將值從一個單元格添加到另一個單元格,然後重置單元格值。 Excel
您對插入有多少控制?你知道最大批量嗎? –
@DuduMarkovitz我一次只有一個文件。 – animal
任何不使用'row_number()over()'的理由? –