boosting

    1熱度

    1回答

    我用gbm函數來實現梯度增強。我想分類。 之後,我使用varImp()函數在梯度增強建模中打印變量重要性。 但是......只有4個變量具有非零重要性。我的大數據中有371個變量......是不是? 這是我的代碼和結果。 >asd<-read.csv("bigdatafile.csv",header=TRUE) >asd1<-gbm(TARGET~.,n.trees=50,distributio

    1熱度

    1回答

    我們通常對名義數據進行一次性編碼,以便更合理地計算距離之間的特徵或權重,但我經常聽說像隨機森林或增強模型這樣的基於樹的模型不需要做一個熱門的編碼,但我已經搜索了互聯網,並不知道,任何人都可以告訴我爲什麼或引導我一些材料來弄清楚?

    0熱度

    1回答

    我剛開始學習關於Solr中的提升,到目前爲止,我已經能夠基於一些特定的短語添加提升查詢,如:bq=manufacturer:sony^2。但是,我現在正在考慮將邏輯應用於提升,但我不確定如何繼續。 具體來說,我已經有多個方面提振查詢像 bq = manufacturer:"sony"^2 name:"bob"^3 town:"place"^4 age:"40"^5 ,但我想知道是否有可能增加另一個

    0熱度

    1回答

    我想知道如何解釋提升查詢。我知道如果一個文檔在bq=name:"bob"^5這樣的提升文件上有匹配,那麼它會被賦予更高的排名,但是通常情況下,如果您有不同字段的許多字詞,那麼當給定的文檔字段與該值不匹配時會發生什麼? 這個術語在bq中只是「丟棄」而被忽略?這是說,如果你有類似bq=name:"bob"^5 location:"Boston"2的東西,但只有在文檔上匹配名稱,那麼它會得到5分,但如果

    1熱度

    1回答

    我使用gbm()函數來創建模型,我想要得到精度。以下是我的代碼: df<-read.csv("http://freakonometrics.free.fr/german_credit.csv", header=TRUE) str(df) F=c(1,2,4,5,7,8,9,10,11,12,13,15,16,17,18,19,20,21) for(i in F) df[,i]=as.fa

    0熱度

    1回答

    Solr的新手在這裏 我構造查詢,以提高我的網頁上的某些項目,我希望能夠提高包含縮略圖(圖像)值字段: <doc> <str name="campaign"/>campaign <str name="productclass">B</str> <str name="thumbnail"> HPMAssets/d120001/derivates/1/250/103/005358625_121

    0熱度

    1回答

    我是新來的彈性搜索。我無法理解文檔中字段的提升值的校準和縮放比例。正如我們應該如何決定領域的提升值,以便它按預期工作。我已經瀏覽了一些在線博客和文檔,寫道es會對值的提升進行規範化和內部優化?這是如何運作的? 例如:如果我們的文檔中有標籤,標題,名稱和文本字段,我們應該如何確定這些值的提升值?

    0熱度

    1回答

    我在R中使用C50軟件包,需要導出生產模型。 我正在使用boosting選項,我知道試驗是加權的,但是在我的輸出中沒有指定權重。 我沒有使用重量選項錯過分類,我只需要試驗的重量。 有沒有辦法通過R知道我的c50模型的每個試驗的重量?對於所使用的所有變量變量

    1熱度

    2回答

    我試圖使用R中的gbm包提高分類樹,我對從predict函數獲得的預測類型有點困惑。 這是我的代碼: #Load packages, set random seed library(gbm) set.seed(1) #Generate random data N<-1000 x<-rnorm(N) y<-0.6^2*x+sqrt(1-0

    2熱度

    1回答

    我正在使用火車包方法= C5.0,並希望將最終模型繪製爲樹狀圖。 結果樹被定義爲: The final values used for the model were trials = 15, model = tree and winnow = FALSE. 當我試圖用陰謀或撥浪鼓的fancyRplotModel繪製樹,我得到以下錯誤:使用 情節: plot(diabetes.c50$final