我只讀過關於CRF的理論,並希望在我的碩士論文中使用python crfsuite從配方中提取配料。每一個幫助表示讚賞。(python)crfsuite自定義功能函數
據我所知,我可以通過下面的圖片的形式向crfsuite提供訓練數據,其中w [0]提供當前單詞的身份,w [i]世界相對於i和pos [我]它的與我有關的詞性標籤。
然後crfsuite訓練自己的特色功能,建立在給定的屬性。
但我無法找到像「w [i]在字典中」這樣的自定義功能函數(例如配方成分字典)或「在句子中是否定」(例如「不「或」不「)。
在總體上是好的教程是值得讚賞的,因爲手冊(https://python-crfsuite.readthedocs.io/en/latest/或http://www.chokkan.org/software/crfsuite/manual.html)不是從我的角度
我現在明白了,可以通過附加標籤來實現特徵功能。例如,當特徵函數以大寫字母開頭時,我可以爲每個單詞添加一個lebel UPPER_CASE或NOT_UPPER_CASE 從我的角度來看,文檔不太好。在閱讀理論後,我預計會覆蓋一些功能。這個標籤技巧很聰明,因爲它獨立於任何編程語言,但對於初學者來說我很聰明...... ^^ –