Top
k
問題 - 在DB搜索BEST k
(3或1000)元素
有根本性的問題,關係數據庫,即到找到top k
elems,需要處理表中的所有行。這使得大數據上的無用。前k個問題 - 我的學術研究發現使用
我正在應用程序(大學的研究,不是我的發明,我執行,並試圖改善原來的想法),其允許您通過訪問存儲的數據的只有3-5%,有效地找到top k
元素。這使得它真的快速。
甚至有用戶偏好,所以在某些領域,你可以指定指定指定最顯著的屬性用戶和聚集功能最有價值的功能。
例如汽車的DB:屬性:(價格,續航里程,車,CCM,燃料/英里,車的類型...的年齡),例如和用戶價值10 *價格+ 5 * fuel/mile + 4 *里程+車齡,(s)他不在乎汽車的類型和其他。 - 這是彙總規範
然後對於每個屬性(價格,里程等),可以有完全不同的「值函數」,爲用戶指定最佳值。例如(價格:越低越好,然後價值下降,高達50,000美元,其中價值爲0(用戶不希望汽車的價格高於50k)里程:基於他/她的標準的其他函數,ans等等...
你可以看到,有相當自由指定你的喜好和acording它,在DB best k
元素將被很快找到。
我已經花了很多不眠的夜晚思考真實生活可用性誰可以從這個查詢db中受益?但是我沒有做出任何事情並堅持只有學術只寫立場。 :-(我希望有可以是一些真正的用法,但我沒有看到任何....
....你有任何想法如何使用,在現實生活中,真實問題等...
I'd love to hear from You.
+1:這是個好主意! :) – DinGODzilla 2009-11-26 11:20:15