我有一個在StringListProperty()中定義的標籤列表。在App Engine上使用StringListProperty查找類似的詞列表
DB包含大約100萬個條目,每個條目在列表中有大約20個不同的值。
例如
一個= [ 'AB', 'BC', 'CA', 'X',....]
B = [ 'X', 'M', 'A',... ]
我使用谷歌應用程序引擎,所以我必須運行批處理作業的限制......(只允許30秒)
這裏是我的問題:
給出一個列表,我想找到所有具有與......共同的元素數量最多的列表,以公共元素數量的降序排列...
我該如何用app引擎做這件事?
***更新
我存儲的網址標籤 - [購物,商店,社交購物,...]
基本上,我想找到它們是通過類似內容的網址
(1)匹配 (2)望着每個URL標籤的頻率來決定哪些URL是標籤「更多」的相關內容
同樣的問題... – 2011-08-03 20:10:30