2010-07-14 53 views
1

我有一個在StringListProperty()中定義的標籤列表。在App Engine上使用StringListProperty查找類似的詞列表

DB包含大約100萬個條目,每個條目在列表中有大約20個不同的值。

例如

一個= [ 'AB', 'BC', 'CA', 'X',....]

B = [ 'X', 'M', 'A',... ]

我使用谷歌應用程序引擎,所以我必須運行批處理作業的限制......(只允許30秒)

這裏是我的問題:

給出一個列表,我想找到所有具有與......共同的元素數量最多的列表,以公共元素數量的降序排列...

我該如何用app引擎做這件事?

***更新

我存儲的網址標籤 - [購物,商店,社交購物,...]

基本上,我想找到它們是通過類似內容的網址

(1)匹配 (2)望着每個URL標籤的頻率來決定哪些URL是標籤「更多」的相關內容

+0

同樣的問題... – 2011-08-03 20:10:30

回答

0

我不認爲有任何整潔的方式在應用程序做到這一點引擎 - 或者就此而言,在任何帶有onl的DBMS中y可用的標準一維索引。

也許如果你擴展你想要達到的目標,有人可以建議一個替代方案?

+0

更新了上述問題。 – demos 2010-07-21 17:21:09