2012-07-02 33 views
3

我將如何去建立一個基於查詢的DataStoreInputReader(而不是讀取每個單一類型的實體)。理由是最小化讀取(因爲查詢被索引到子集)以及處理時間。如何基於查詢構建自定義DatastoreInputReader?

  1. 首先,這是一個好主意嗎?還是會有實際的時間和處理節省 使用查詢支持的自定義數據存儲輸入讀取器或將 查詢本身取消mapreduce並行或添加其他開銷?

  2. 二,怎麼做?我一直在閱讀* input_readers.py *和 不知道如何將AbstractDataStoreInputReader子類化爲 這樣做。也許有人可以解釋執行 的過程,因爲從閱讀代碼並不清楚(並且 文檔已過時或不存在)。

布朗尼指向那些可以指向工作代碼(github或其他)顯示自定義數據存儲輸入讀取器實現的人。

這將是使AppEngine上的MapReduce更多開發者訪問或友好;-)

回答

0

從文檔DatastoreInputReader巨大:

這位讀者不無過濾:你需要做任何需要的 濾波在你的映射器中。