這適用於Google App Engine,但不一定受此限制。攤銷適用於App Engine的分配(和百分比)計算?
在Google App Engine上,數據庫不是關係數據庫,因此不能實現聚合函數(如總和,平均值等)。每一行都是相互獨立的。爲了計算總和和平均值,應用程序只需通過重新計算每個新寫入到數據庫的數據來分攤計算,以便它始終保持最新。
如何計算百分位數和頻率分佈(即密度)?我想繪製一個值域的密度圖,這組值可能是數百萬的數量級。循環遍歷整個數據集可能是可行的(每個查詢的限制是返回1000行),並基於此計算,但我寧願採取一些智能方法。
是否有一些算法可以計算或近似密度/頻率/百分比分佈,可以計算一段時間?
順便說一句,數據是不確定的,因爲最大值和最小值可能是全部的地方。因此,分佈將需要大約95%的數據,並且僅基於該數據做密度。
GAE限制了操作可能需要多長時間以及數據存儲區CPU時間。一切都以http請求完成,因此每個請求只有很多數據可以通過。如果採用更簡單的方法,將大型工作劃分爲多個操作併合並結果可能會遇到麻煩。 – 2009-05-25 23:17:51