阿帕奇豬JOIN不像預期的那樣表現

2014-03-30 22 views 0 likes

我是新來的阿帕奇豬。我用tab分隔字段創建了2個文件; employees.txt和employees2.txt [有在文件中沒有行間距，這是satisify這個編輯器]阿帕奇豬JOIN不像預期的那樣表現

employees.txt包含：

joe  21  94085 50000.0 
Tom  21  94085 50000.0 
John 21  94085 50000.0

employees2.txt包含：

joe  4085559898 
joe  4085559899 
tom  4085559897 
tom  4085559896 
john 4085559896

後來我嘗試一個簡單的加入：

個

e1 = LOAD 'employees.txt' AS (name, age, zip, salary); 
e2 = LOAD 'employees2.txt' AS (name, phone); 
e3 = JOIN e1 BY name, e2 BY name; 
DUMP e3;

結果：

(joe,21,94085,50000.0,joe,4085559899) 
(joe,21,94085,50000.0,joe,4085559898)

我預計：

(joe,21,94085,50000.0,joe,4085559899) 
(joe,21,94085,50000.0,joe,4085559898) 
(Tom,21,94085,50000.0,Tom,4085559897) 
(Tom,21,94085,50000.0,Tom,4085559896) 
(joe,21,94085,50000.0,Tom,4085559896)

我在做什麼錯？

感謝，

克里斯

來源

2014-03-30 Chris Rigano

回答

像幾乎所有的計算機語言，豬是區分大小寫的。因此「喬」！=「喬」和「湯姆」！=「湯姆」。

您應該將employees.txt文件中的名稱更改爲小寫。那麼你應該得到預期的結果。

您可以使用內置的Pig字符串函數LOWER來完成將名稱字段轉換爲全部小寫字母的任務。

e1 = LOAD 'employees.txt' AS (name, age, zip, salary); 
e2 = LOAD 'employees2.txt' AS (name, phone); 
e1_lower = FOREACH e1 GENERATE LOWER(name),age,zip,salary; 
e3 = JOIN e1_lower BY name, e2 BY name; 
DUMP e3;

：沿線的

東西

來源

2014-03-30 19:36:17 JamCon

相關問題

11. 阿帕奇豬當量的選擇*
12. 阿帕奇豬的解釋功能
13. 矩陣乘法阿帕奇豬
14. 阿帕奇豬 - url解析成地圖
15. 阿帕奇豬過濾出回車
16. 阿帕奇豬計數排序
17. 阿帕奇豬根據條件商店
18. 阿帕奇豬 - 從時間戳
19. JOIN查詢不像預期的那樣運行
20. float的訪問說明符不像預期的那樣表現
21. C++條件變量wait_for表現得不像預期的那樣
22. systemLayoutSizeFittingSize：在UILabel上表現不像預期的那樣
23. 阿帕奇：塊外上市的那些
24. defaultdict constant_factory並不像預期的那樣
25. FusionCharts：X軸值不像預期的那樣
26. SWTbot測試不像預期的那樣
27. zftool不像預期的那樣運行
28. 寬度並不像預期的那樣
29. usort並不像預期的那樣
30. Hash.new（[]）並不像預期的那樣