找到前k大按鍵可以說我有一本字典:字典中的蟒蛇
{key1:value1........... keyn:valuen}
所以,可以說,我想編寫一個函數
def return_top_k(dictionary, k):
return list_of_keys_sorted
什麼是最有效的方式(以大O的條款)來獲得具有最高k值的鍵(保持順序,即最高值鍵存在於開頭等等)。
找到前k大按鍵可以說我有一本字典:字典中的蟒蛇
{key1:value1........... keyn:valuen}
所以,可以說,我想編寫一個函數
def return_top_k(dictionary, k):
return list_of_keys_sorted
什麼是最有效的方式(以大O的條款)來獲得具有最高k值的鍵(保持順序,即最高值鍵存在於開頭等等)。
O(n log k)
:
import heapq
k_keys_sorted = heapq.nlargest(k, dictionary)
你可以使用key
關鍵字參數指定應該用什麼作爲排序鍵如:
k_keys_sorted_by_values = heapq.nlargest(k, dictionary, key=dictionary.get)
return sorted(dictionary, key=dictionary.get, reverse=True)[:10]
應該是在最壞的情況O(NlogN)
(雖然被別人提出heapq
可能是更好的)...
它威力也是有道理使用Counter
,而不是一個普通的字典。在這種情況下,most_common
方法將會(大約)做你想要的(dictionary.most_common(10)
),但前提是在API中使用Counter
是有意義的。
這是完美的。我會補充說,如果字典發生在計數字典中,'collections.Counter'就是正確的數據結構。那麼解決方案就是'[k for k,v in counts.most_common(10)]'。 –
對於頂3分步:
>>> from operator import itemgetter
>>> dct = {"a": 1, "b": 2, "c": 3, "d": 4, "e": 5}
>>> sorted(dct.items(), key=itemgetter(1), reverse=True)
[('e', 5), ('d', 4), ('c', 3), ('b', 2), ('a', 1)]
>>> map(itemgetter(0), sorted(dct.items(), key=itemgetter(1), reverse=True))
['e', 'd', 'c', 'b', 'a']
>>> map(itemgetter(0), sorted(dct.items(), key=itemgetter(1), reverse=True))[:3]
['e', 'd', 'c']
或使用heapq
模塊
>>> import heapq
>>> heapq.nlargest(3, dct.items(), key=itemgetter(1))
[('e', 5), ('d', 4), ('c', 3)]
>>> map(itemgetter(0), _)
['e', 'd', 'c']
在代碼
dct = {"a": 1, "b": 2, "c": 3, "d": 4, "e": 5}
k = 3
print sorted(dct.keys(), reverse=True)[:k]
如果您還需要值:
print sorted(dct.items(), reverse=True)[:k]
或者,如果你想使用OrderedDict
:
from collections import OrderedDict
d = OrderedDict(sorted(dct.items(), reverse=True))
print d.keys()[:k]
portfolio = [
{'name': 'IBM', 'shares': 100, 'price': 91.1},
{'name': 'AAPL', 'shares': 50, 'price': 543.22},
{'name': 'FB', 'shares': 200, 'price': 21.09},
{'name': 'HPQ', 'shares': 35, 'price': 31.75},
{'name': 'YHOO', 'shares': 45, 'price': 16.35},
{'name': 'ACME', 'shares': 75, 'price': 115.65}
]
cheap = heapq.nsmallest(3, portfolio, key=lambda s: s['price'])
expensive = heapq.nlargest(3, portfolio, key=lambda s: s['price'])
說起字典使用計數「k」令人困惑,因爲它通常代表「關鍵」。改用'n'。 –