Scikit-learn具有用於機器學習的相當用戶友好的Python模塊。如何使用scikit-learn的SVM使用非整數字符串標籤? Python
我正在嘗試爲自然語言處理(NLP)訓練SVM標記器,其中我的標籤和輸入數據是單詞和註釋。例如。標記,而不是使用雙/整數數據作爲輸入元組[[1,2], [2,0]]
部分的詞性,我的元組看起來就像這樣[['word','NOUN'], ['young', 'adjective']]
誰能給的,我怎麼可以使用SVM用繩子元組的例子嗎?這裏給出的教程/文檔是針對整數/雙輸入的。 http://scikit-learn.org/stable/modules/svm.html
+1。請注意,對於POS標記,POS窗口只能朝一個方向延伸。詞語窗口也可以提供良好的特徵(至少對於NER和WSD來說它們工作得很好)以及正在考慮的單詞的固定長度詞綴。 –