2013-03-18 42 views
1

由Ghahramani和Heller(http://mlg.eng.cam.ac.uk/zoubin/papers/bsets-nips05.pdf)提出的貝葉斯集提供了一種基於查詢(例如,狗會返回貓,寵物)來查找物品組並且生成與谷歌集相當的輸出的有用方法。我想知道如何在沒有首先提供單詞(item)作爲查詢的情況下使用該方法來查找頂級集。是否有人知道在貝葉斯集合上主動學習密度最高的集合?貝葉斯集和查找頂集

+1

我不確定我是否理解這個問題。貝葉斯集合返回與查詢相關的項目。如果你沒有查詢,沒有任何關係。什麼是「頂級套裝」? – 2013-03-18 13:48:30

+0

讓我解釋爲什麼我需要數據集中頂級(或突出)集合的列表。我不希望用戶指定查詢,而是想向用戶展示在數據集中找到的集合列表。我想排列這些集合。 – orbital 2013-03-19 00:22:20

回答

0

貝葉斯集本質上執行特徵選擇(請參閱:基於內容的圖像檢索的簡單貝葉斯框架)來對集合中的項進行排序。而特徵的權重是通過這個集合的種子例子來決定的。沒有種子,就沒有辦法做到這一點。所以它歸結爲找到「種子集」。爲了做到這一點,你可以在數據中找到「簇」(比如使用K均值),並將它們的「質心」(或者表示簇的數據點)作爲種子集提供。基本上,你現在要做的是對每個羣集中的項目進行排名(你可以稱之爲頂級項目)。