問題:給定一組手工分類的字符串(或一組有序的字符串向量)生成一個分類函數,以對更多輸入進行分類。就我而言,這些數據(或大部分數據)不是自然語言。字符串中的機器學習和代碼生成器
問題:是否有任何工具可以做到這一點?我正在考慮一些合理的打磨,下載,安裝和類似的事情,而不是一些圖書館或一個脆弱的學術計劃。
(不要停留在細節,請儘快與真正細節將限制答案通常較少有用的答覆,並簽署保密協議。)
由於我正在尋找一個例子;我想要過濾的輸入是從日誌中提取的計算機生成的狀態字符串。根據需要通知誰或需要採取什麼操作來過濾錯誤消息(作爲示例)。
您可能想更多地談談要分類的字符串。例如,它們是由自然語言數據(例如,電子郵件或其他文件)組成的嗎? – dmcer 2010-05-14 18:18:03
您是否有權訪問源代碼,即您是否擁有所有可能的狀態字符串列表? – 2010-05-15 01:02:50
錯誤消息是一個例子。 OTOH我無法訪問生成輸入的東西。 – BCS 2010-05-16 00:31:05