1

我有某種對象模型,我需要過濾和排序它的某些屬性的節點。存在哪些自動化系統來生成和選擇與我想要的相關的對象模型的屬性? (我故意是抽象的和非特定的)如何過濾/排序/排列對象模型節點?

我在考慮一種類似於垃圾郵件過濾器或監督分類系統的系統,它給出了一個示例數據集,它標識了查找感興趣節點的規則。不過,我正在尋找一個更通用的系統,因爲它不需要關於對象模型的任何設計時間信息。它應該像電子郵件上的垃圾郵件過濾器,代碼庫中的bug查找器,新聞組中的感興趣過濾器或社交網站上的機器人帳戶查找器一樣工作平等。只要它可以通過反射探索對象模型,並給予一組「有趣」的節點,它應該能夠找到可以找到更多類似它們的節點的規則。

+1

BTW:我不會感到驚訝,如果沒有很好的解決方案存在。 – BCS 2009-08-13 17:45:57

回答

1

這是極不可能的,有一個單一的自動分類系統,它可以做所有你是問。此外,我相信這個bug發現者申請屬於這種系統的範圍之外,因爲這是在該領域被成功地用於各地句法分析,數據流分析,以及高度定製的周邊軟件錯誤問題的其他算法的方法主要是旋轉的方法。雖然機器學習研究正在那裏進行,但是這個領域的分類系統大多被用來擴充而不是替代分析方法(據我所知)。

對於大多數不平凡的分類問題,精心選擇和問題表徵的細化,通常需要以獲得通過機器學習有用和有效的結果。簡單地使用現有的「原始」數據對象模型而沒有對狀態空間進行某種特定的轉換,往往會導致輸入數據值分佈的不完全覆蓋和/或學習分類器的泛化不佳。此外,正在使用的機器學習方法特有的其他參數可能需要反覆試驗以獲得給定問題的體面結果。並不是所有的方法都有這樣的參數,但是很多都是如此,比如神經網絡,遺傳算法,貝葉斯推理方法等。

你所要求的是一種幾乎通用的機器學習方法,它不是當前存在的東西。我能看到的最可行的替代辦法是:(1)發現的不同問題的一個子集針對這不會是性能/複雜性所需要的水平,或(2)創建一個使用不只是一個分類技術,而是一個系統有一個不同方法的工具箱,它可以針對給定問題自動進行測試,然後使用在監督學習制度下產生最佳分類結果的方法。後者仍然是一個非常有挑戰性的問題,但它並沒有消除如何表示/轉換數據模型的狀態空間的問題。

+0

最後一句「如何表示/轉換數據模型的狀態空間」。實際上描述了我想知道的有關解決方案的問題。 – BCS 2010-06-15 18:16:23

+0

狀態空間模型問題的一種可能性是擴展「工具箱」概念,並有各種不同的表示方式自動測試出來。這可以包括(1)無變換[這可能工作確定對於一些類型的離散值或文本數據的],(2)概念簇或自然語言的本體,(3)粗編碼表示爲數字數據,等。這些也可能是一種通用的方案,它提供了一種很好的機會來以一種有用的方式分割國家空間,以便更容易地學習模式,但缺乏更多定製方法的能力。 – 2010-06-15 18:57:09