好吧 - 我有一個兩難的問題。到目前爲止我的腳本將頁面標題轉換爲類別。這是基於關鍵字,當匹配時添加了某個分數,也就是說某些詞語的值爲10,有些詞語只有1。這會累積到每個類別的總分中。Python - 查找數組中排名最高的數字
[{15: [32, 'massages']}, {45: [12, 'hair-salon']}, {23,:[3, 'automotive service']}]
索引是所述類別ID,第一值的得分第二值的類別。
在某些情況下,這跨越了超過10個類別匹配。
我怎麼可以這樣進行過濾,僅前60-75%
即清楚地按摩和美髮沙龍是最大,因爲它們都遠遠高於汽車服務。但是,我們如何使用這種智能進行編程?
我在想stddev可以幫忙嗎?
編輯
我試圖例如過濾掉低分項目
data = [{15: [32, 'massages']}, {45: [1, 'hair-salon']}, {23:[1, 'automotive service']}]]
按摩是在這種情況下,唯一的高得分項
data = [{15: [4, 'massages']}, {45: [2, 'hair-salon']}, {23:[1, 'automotive service']}]]
史迪威按摩
data = [{15: [10, 'massages']}, {45: [50, 'hair-salon']}, {23:[5, 'automotive service']}]]
現在頭髮沙龍(因爲它是遠高於其他)
所以我不需要第一個(N)對象,而且第一個對象的x高於其他數字作爲percen標準偏差的標準或形式。
所以50要高得多,然後10和5
10要高得多然後3或2
然而9,8和6是大致相同的
你的例子看起來像一個詞典列表,而不是字典詞典..無論如何,排序有什麼錯? – Aprillion
Python詞典是無序的,所以如果你想按照分數對這些條目進行排序,你需要將它們存儲在首先像列表一樣排列的東西中。之後,您可以刪除最低的25-40%,這將在正常升序後列表的開頭。 – martineau
噢,是的,我的意思是使它成爲一個詞典列表 – AlexZ