2011-06-20 58 views
2

這是我的用例:功能有可能成爲聚類算法的列表嗎?

我有網絡資源和每個資源的一組視圖。它來自網絡導航,所以資源是您訪問的內容,並且視圖是實際訪問。

對於每個視圖,我都有關於位置的信息,查看當天的時間,以及我可以獲得的信息,如視圖的總數和在此資源上傳遞的時間。

我想查找此信息中的不同模式,以確定用戶配置文件。如果對於每個資源我只有一個視圖,可以很容易地對它們進行羣集,但是由於我確實有很多視圖,是否有一種方法可以使用此信息來更好地羣集資源?

回答

1

如果我理解正確,您希望根據他們擁有的視圖來聚集資源。爲此,您可能需要根據視圖的統計信息製作一個特徵向量。例如,您的特徵向量可以包括:總觀看次數,觀看者位置的標準差,觀看日的平均時間,資源年齡等。然後,您可以將這些特徵向量饋入聚類算法。您要使用的確切功能將取決於您對集羣的使用情況。如果你想讓集羣反映資源的內容,並且資源是基於文本的,那麼我會推薦使用bag of words

+0

謝謝,這正是我所期待的。我正在計算stdev,avg和其他指標,它的功能就像一個魅力。 –

0

很難說出你到底在問什麼。是的,feature vectors被廣泛用於機器學習算法。