0
我有成千上萬的大型標籤雲數據集;我可以檢索每個組的加權標籤雲用一個簡單的選擇/組語句(例如)比較大型加權標籤雲集?
SELECT tag, COUNT(*) AS weight
FROM tags
WHERE set_id = $set_id
GROUP BY tag
ORDER BY COUNT(*) DESC
我想知道的是 - 什麼是比較加權標籤雲的最佳途徑找到最相似的其他集合,以重量(出現的一組中的數字)考慮在內,甚至可能是計算比較分數,都在同一個有些effiecient聲明?
我發現缺乏在網絡上的話題質量文獻,認爲它一定程度上廣泛有關,並試圖抽象我的例子,以保持它的普遍適用。
雖然理論似乎聲音,我不知道如何在飛行比較上千套的標籤時,這會實現,在一個幸福的聲明.. – JeremyFelix 2010-06-19 16:41:29
通常不需要這些密集的任務是實時數據,因此你並不需要能夠在MySQL中完成它們,只需獲取雲並以異步方式處理它們即可。然後將結果存儲在數據庫中。 – Jack 2010-06-19 16:43:07