2017-08-01 102 views
-3

我正在研究需要確定單詞是否爲水果的項目。我已經嘗試了幾種方法,但對任何結果都不滿意。有什麼建議麼?將文本分類爲多個類別

我的訓練集看起來像這樣

  • 輸入:蘋果是一種水果。 輸出:Apple。
  • 輸入:番石榴也是水果輸出:番石榴。
  • 輸入:菠蘿是一種時令水果輸出:菠蘿。外面訓練數據運行時

例子:

  • 輸入:我喜歡所有的水果,但最喜歡的是番石榴和蘋果。 輸出:番石榴,蘋果
+0

你到目前爲止嘗試過什麼。我假設你只是想要一個現成的解決方案。請改述你的問題 –

+0

我到目前爲止使用scikit學習SVM所做的工作對於單一標籤的分類效果很好,但對於多標籤來說性能並不好。我想了解如何解決我的問題。 @ArpitSolanki –

+0

你只需要從字符串中提取信息(_i _._ e_。水果名稱)?如果是這樣,多標記分類器可能會矯枉過正。 – arturomp

回答

1

此任務被稱爲命名實體識別。你可以閱讀關於on Wikipedia的初學者。

一個受歡迎的圖書館是斯坦福大學的CoreNLP。你可以在Stanford Natural Language Processing Groups website上閱讀。

爲了使用它,您需要在訓練數據中標記每個標記(單詞),以指示它是否爲水果。希望這可以幫助。

+0

@Soham Chakraborty對您有幫助嗎? – langkilde