1

我在R中很新,我找不到任何有關可以執行以下操作的包的信息:假設我有一組數據(例如不同的文本文檔),它們可以有幾個類。使用R的分層預測

例如,基準可以是運動,帶球的運動,無球運動和汽車。我希望能夠預測數據屬於哪個類別,考慮到我可能沒有達到該數據是帶球的體育項目,但是如果我正確地預測這是一項運動項目,我會很高興。

哪個包可以提供這種東西?如果可能的話,一些例子會很有用。

在此先感謝

+0

你能否讓你的解釋和例子更清楚?您是否在尋找多標籤分類器,以便每個數據可以同時屬於多個類?你爲什麼稱它是分層的? –

+0

這不完全是多標籤。我把它稱爲等級制,因爲我必須將我的數據分類到以下「離開」類中:rec/autos,rec/motorcycles,rec/sport /棒球,rec/sport/hockey,sci/crypt,sci/med。請注意,我希望能夠預測某些數據,例如至少來自rec類,並嘗試在rec子類中進一步推進。那有意義嗎? – gcolucci

+0

你可以修改你的問題來顯示hiererachy在哪裏嗎?也許你對SVMstruct感興趣(http://www.cs.cornell.edu/people/tj/svm_light/svm_struct.html),它不是R,但我不知道R中有任何結構化的分類工具。也許別人有指針? –

回答

0

我不知道R中的任何特定的軟件包,可以做到分層分類的。所以有兩種選擇:

  • 使用C API SVMstruct http://www.cs.cornell.edu/people/tj/svm_light/svm_struct.html。從頭開始編程這將是一些工作。
  • 構建您自己的分層分類系統。在自頂向下的情況下,您將爲每個級別設置一個多級分類器,例如rec vs sci和摩托車vs sport等。您將使用頂級分類器並使用其預測來選擇下一個分類器。用於訓練帶有節點的分類器的數據是以該節點爲根的子樹中所有數據的並集。

有關詳細信息,例如, http://jmlr.org/papers/v6/tsochantaridis05a.html

+0

感謝您的幫助,@kap。我會盡力執行你的第二個建議,讓我們希望一切順利 – gcolucci