everyone。 我使用Baum-Welch算法來訓練pos tagger,它完全採用無監督的方式。 問題出在這裏: 當我得到標籤結果時,我只能得到一個數字序列。 我不知道哪個標籤代表VV,NN,DT。 我該如何解決這個問題?用於pos tagger的Baum-Welch算法
3
A
回答
4
一般來說,沒有辦法做到這一點。 Baum-Welch將找到具有相似分佈的詞類使用類,但沒有特別的理由可以假設這些類將以任何直接的方式映射到任何特定語言理論所提出的類別。因此,無監督的POS標籤主要用於你關心單詞或短語的等價類但不關於被分配的特定標籤的應用。
如果你真的需要人類可讀的標籤,但是(例如,在開發過程中,爲了評估你得到的結果是否是遠程合理的),我會手工標記幾十個句子。然後,您可以將您的B-W導出的標註器應用於標記爲小型語料庫的標籤,以誘導類編號和POS標籤之間的映射。
+0
在我看來,無監督的方式似乎不是一個很好的選擇來創建一個有用的pos標記。謝謝你的解釋!! – David 2011-03-12 13:00:04
相關問題
- 1. Pos Tagger in PHP
- 2. 刪除POS tagger的標籤
- 3. JCreator Java中的Standford POS tagger?
- 4. Stanford Spanish POS Tagger的含義
- 5. Stanford POS tagger:-filelist選項不起作用
- 6. 來自java程序的Stanford POS Tagger maxentTagger
- 7. 什麼是NLTK POS tagger要我下載?
- 8. nltk pos tagger看起來合併'。'
- 9. 處理NLTK Stanford POS Tagger輸出
- 10. Stanford POS tagger與GATE twitter模型很慢
- 11. 以conll格式輸出結果(POS-tagging,stanford pos tagger)
- 12. Stanford POS Tagger無法標記中文文本
- 13. 如何正確設置NLTK中的Hunpos tagger用於英文POS標記?
- 14. 使用stanford pos tagger的阿拉伯語標記
- 15. 使用nltk pos tagger時出現錯誤的zip文件錯誤
- 16. 如何在Python中使用nltk stanford pos tagger解析大數據
- 17. 刪除複數,而使用斯坦福pos tagger
- 18. 使用多個文本文件訓練Stanford POS tagger
- 19. 如何使用python pos tagger檢測關係
- 20. 如何在C#代碼中使用python NLP POS tagger?
- 21. Stanford POS tagger不能在類路徑中使用SLF4J
- 22. 什麼算法用於Pascal中的Pos()函數?
- 23. 尋找POS-Tagger的HMM模型的準確性
- 24. 從skinned pos計算unskinned pos
- 25. 識別斯坦福POS Tagger中的搭配?
- 26. 在Python中訓練TBL POS Tagger時的內存錯誤
- 27. Stanford Tagger with GATE
- 28. 如何在Python中將特定功能添加到CRF POS Tagger?
- 29. 韓國,泰國和印度尼西亞POS tagger
- 30. 在eclipse中重新訓練stanford nlp pos tagger
你在標註什麼語言? – dmcer 2011-03-08 04:12:52
你應該得到每個單詞的概率,然後你選擇一個概率最高的單詞。 – ealdent 2011-03-08 15:26:26
但是我不知道哪個標籤代表哪個pos標籤。我只得到1 2 3 5 2 3 – David 2011-03-09 11:24:41