2013-04-20 77 views
0

我發現了一個關於多項樸素貝葉斯分類計算B和| V |在樸素貝葉斯文本分類

multinomial naive bayes link

聯繫我們如何計算B'|V|

頁說,這是在詞彙方面的數量。在它的例子中,我們如何能得到6B?這是所有術語的計數嗎?

「中國」, 「北京」, 「上海」, 「meacao」, 「東京」, 「日本」

還有一個問題,如果新名詞出現的測試文件在哪?例如,在文檔6中出現「曼谷」或任何從未出現過的新詞。如何計算新術語的概率?

回答

1

你是對的。這是詞彙表中單詞的總數,因爲在詞彙表中只能有一個詞條目。

+0

謝謝你,我只是想確認一下。 :) – mhabibi 2013-04-20 08:32:21

+0

還有一個問題,如果新術語出現在測試文檔中會怎樣? 例如,在doc 6中出現「曼谷」或任何從未出現過的新單詞。如何計算新術語的概率? 謝謝激情:) – mhabibi 2013-04-20 09:38:23