2017-02-27 20 views
0

Hierarchical Dirichlet Process中,作者使用中餐廳特許權解釋了HDP。它說每家餐廳都有很多餐桌,不同的餐桌可能在一家餐廳共用一道菜。這裏的菜我們可以認爲是文檔中的一個主題,那麼如何理解每個文檔中的表?我認爲不同的餐桌應該訂購不同的菜餚,如果兩張桌子有相同的菜,那麼爲什麼不把它們合併成一個?非常感謝。如何理解分層Dirichlet過程(HDP)中的「表格」?

enter image description here

回答

0

在中國的特許經營餐廳(CRF),每個文件是一間餐廳,每個字是客戶和羣集參數菜餚以表從全局菜單。一位顧客進入一家餐廳,坐在一張桌子上,其概率與已經在餐桌上的顧客數量成正比,或坐在一張以概率α表示的新餐桌上。然後爲新桌子分配一個特定的盤子,其概率與已經服務該盤子的桌子的數量成正比,或者具有概率γ的新盤子的概率。

因此,對於每個客戶,我們都有一個將客戶映射到表格的索引,對於每個表格我們都有一個將表格映射到其中一個盤子的索引。吉布斯採樣算法首先對與數據相關的表格進行採樣,然後對與每張表格關聯的盤子進行採樣。欲瞭解更多詳情,請參閱Yee Whye Teh's implementation