-3
我正在研究需要確定單詞是否爲水果的項目。我已經嘗試了幾種方法,但對任何結果都不滿意。有什麼建議麼?將文本分類爲多個類別
我的訓練集看起來像這樣
- 輸入:蘋果是一種水果。 輸出:Apple。
- 輸入:番石榴也是水果輸出:番石榴。
- 輸入:菠蘿是一種時令水果輸出:菠蘿。外面訓練數據運行時
例子:
- 輸入:我喜歡所有的水果,但最喜歡的是番石榴和蘋果。 輸出:番石榴,蘋果
我正在研究需要確定單詞是否爲水果的項目。我已經嘗試了幾種方法,但對任何結果都不滿意。有什麼建議麼?將文本分類爲多個類別
我的訓練集看起來像這樣
例子:
此任務被稱爲命名實體識別。你可以閱讀關於on Wikipedia的初學者。
一個受歡迎的圖書館是斯坦福大學的CoreNLP。你可以在Stanford Natural Language Processing Groups website上閱讀。
爲了使用它,您需要在訓練數據中標記每個標記(單詞),以指示它是否爲水果。希望這可以幫助。
@Soham Chakraborty對您有幫助嗎? – langkilde
你到目前爲止嘗試過什麼。我假設你只是想要一個現成的解決方案。請改述你的問題 –
我到目前爲止使用scikit學習SVM所做的工作對於單一標籤的分類效果很好,但對於多標籤來說性能並不好。我想了解如何解決我的問題。 @ArpitSolanki –
你只需要從字符串中提取信息(_i _._ e_。水果名稱)?如果是這樣,多標記分類器可能會矯枉過正。 – arturomp