7

什麼是條件隨機場條件隨機字段如何在結構化或非結構化文本中將專有名稱標識爲人員,組織或地點?使用條件隨機場進行命名實體識別

例如:本品由計算器公司訂購

是什麼條件隨機場做鑑定計算器公司作爲一個組織?

回答

16

CRF是一個有區別的批處理標記模型,與最大熵馬爾可夫模型在同一個通用族中。

完整的解釋是書的長度。

的簡短說明如下:

  1. 人類註釋文本200-500K的話,標誌着實體。
  2. 人類選擇一組他們希望指示實體的功能。像大寫字母這樣的東西,或者這個詞是否在帶有標籤的訓練集中看到。
  3. 訓練過程計算所有特徵的出現次數。
  4. CRF算法的肉搜索適合計數的所有可能模型的空間以找到相當好的模型。
  5. 在運行時,解碼器(可能是維特比解碼器)查看一個句子,並決定分配給每個單詞的標籤。

的這個困難的部分是特徵選擇和步驟4

0

那麼明白,你必須學習的東西很多的搜索算法。
開始

瞭解馬爾可夫和貝葉斯網絡的基本。
在coursera提供在線課程,由達芙妮科勒
https://class.coursera.org/pgm/lecture/index

CRF是一種特殊類型的馬爾科夫網絡,我們有觀察和隱藏的狀態。
目標是找到最佳的狀態分配給未觀察到的變量,也稱爲MAP問題。
準備好大量的概率和優化。 :-)