2

我不得不爲計算機科學領域構建一個概念分析器,並將其用於此機器學習,即Python的橙色庫。我有概念的例子,其中的特徵是引理和詞類,如算法| NN |概念。問題在於,由於缺乏負面的例子,任何其他的詞,實際上不是一個概念,都被歸類爲一個概念。將所有其他單詞放在學習文件中是不可行的,歸類爲簡單單詞而不是概念(這會起作用,但不是一個解決方案)。任何想法?負面實例的機器學習問題

謝謝。

+0

你需要更好地闡明你的問題。你試圖解決/檢測/分類的問題是什麼?你的訓練數據的性質是什麼?詞性標記如何幫助你完成任務?反面例子究竟是什麼意思? – 2010-01-26 03:18:25

回答

2

的問題是非常不清楚,但假設你的意思是,你的機器學習算法是不工作沒有負面例子,你不能給它的每一個可能的負面例子,那麼這是完全正常的,給它一些負例子。

數據挖掘(也稱爲機器學習)的要點是嘗試根據相對較小的數據樣本制定一般規則,然後將其應用於較大的數據。在現實生活中的問題你會從來沒有擁有所有的數據。如果你有所有可能的輸入,你可以很容易地創建一個簡單的if-then規則序列,它總是正確的。如果真是那麼簡單,機器人現在就會爲我們做我們所有的想法。