2012-02-16 340 views
-1

我想計算字符串中每個字符出現在整個字符串長度的條件可能性。說str = {女士},所以P(m)= m出現的次數/ m的總數。但是,對於每個字符,總概率應該總和爲1,即P(m)= 1; P(a)= 1等等。我堅持這一點,如果下面的代碼被修改以合併這一點,我們將不得不承擔責任。概率的計算

+2

嗯......在你的代碼中你計算的概率是多少? – 2012-02-16 19:27:16

+2

對於這個問題,getche()是什麼? – 2012-02-16 19:28:11

+4

我不認爲你在處理「概率」問題。 「頻率」可能是一個更好的術語。你已經知道你的數據的一切,所以沒有什麼隨機的。 – 2012-02-16 19:28:14

回答

2

在開始編程之前,您可以/應該考慮您要計算的內容。首先閱讀這個:https://en.wikipedia.org/wiki/Bigram然後這個:https://en.wikipedia.org/wiki/N-gram。它會讓你開始計算n-grams的條件頻率(這就是你所需要的)的含義

+0

詢問之前使用Google搜索它。謝謝你的鏈接。其目標與N Gram計算類似。因此,如何使用我已經完成的工作爲此編碼。 – Chaitali 2012-02-16 19:40:52

+0

這並不容易。我建議你從計算Bigram矩陣開始。如果你得到這個工作,你可以概括你的程序。要爲一組給定的字符串計算Bigram矩陣,首先用全零(矩陣的寬度和高度匹配字母表中的字母數)初始化矩陣。然後你重複遍歷字符集中的所有字符串;爲每個字母的每個字符串遞增矩陣中座標爲(x,y)的條目,其中x是前一個字母,y是當前字母。最後,你必須按列數除以每一項。 – 2012-02-16 19:53:18

+0

這與前向算法相似嗎?我的意思是馬爾可夫模型中的前向算法和這個算法做同樣的任務嗎?還是Baum Welch算法? – Chaitali 2012-02-16 20:08:11