2013-07-21 93 views
2

我在這種情況下。我有一個變量data其中包含的價值在此格式的信息列表:根據另一個查詢的結果篩選列表

data:(id:int, value:float) 

然後,我有一個包含一些元數據的另一個變量:

m:(id:int, var1:int, var2:int) 

我想要做的是:

  1. 過濾器m以便取得滿足元數據 的一些條件的id的列表篩選器data,只保留id位於第一個查詢的結果集中的元組。

I.e.是這樣的:

wanted_metadata = filter m by CONDITION 
wanted_ids = foreach wanted_metadata generate id 
wanted_data = filter data by id IS INCLUDED IN wanted_ids 

暫時,我設法,使用JOIN操作符的事,但我更願意用一些「成員資格檢查」操作符。

你能幫我嗎?

+1

我認爲內連接正是你應該使用的。只要看看[這個圖](http://www.w3schools.com/sql/sql_join_inner.asp)。您在這裏使用加入__is__會員資格檢查。 – mr2ert

回答

2

如果您的數據足夠小以適合內存,則使用replicated join,這是地圖邊連接,它是作爲成員資格檢查執行的。

相關問題