2013-10-08 50 views
0

我有一個IP地址列表。我需要爲每個IP分配一個國家。 例如http://www.ip2nation.com/提供此服務。 我已經找到了IP2Country的一些數據庫,但是如何將它與豬整合?如何根據IP獲取國家名稱

輸入:

14.59.63.28 
145.89.87.211 
54.27.253.89 
98.201.50.22 
116.48.29.143 
145.89.87.211 
20.109.204.65 
20.109.204.65 

預期輸出:

14.59.63.28  country1 
145.89.87.211 country2 
54.27.253.89 country3 
98.201.50.22 country4 
116.48.29.143 country5 
145.89.87.211 country2 
20.109.204.65 country6 
20.109.204.65 country6 

回答

0

您將需要從數據庫中獲取IP的數據庫和國家名稱的提取物。 然後使用該提取的數據來執行與您流式傳輸的數據的連接。

我會直接加入。爲了獲得更好的性能,你可以檢查複製加入Pig http://pig.apache.org/docs/r0.7.0/piglatin_ref1.html#Replicated+Joins

+0

我有隨機生成的IP地址,其中很少不在數據庫IP地址範圍內(不匹配),所以我認爲加入是不可能的...對? –

相關問題