knn

    9熱度

    3回答

    我嘗試運行這行: knn(mydades.training[,-7],mydades.test[,-7],mydades.training[,7],k=5) ,但我總是得到這個錯誤: Error in knn(mydades.training[, -7], mydades.test[, -7], mydades.training[, : NA/NaN/Inf in foreign f

    1熱度

    1回答

    我想在WEKA GUI中使用帶TF-IDF的KNN算法。首先,我在默認條件下運行算法。其次我在StringToWordVector過濾器中選擇「IDFTransform」和「TFTransform」爲「true」並運行。 還有沒有什麼區別有兩個結果。 結果1: Correctly Classified Instances 1346 91.3781 % 結果2: Correctly Cl

    0熱度

    1回答

    我已經設置了約200個點(x,y)的圖像。 200個數據屬於11個類別(我認爲這將成爲類別標籤)。我的問題是如何將x,y值表示爲一個數據? 我的第一個想法是,我應該用標籤分別表示它們,然後當我得到一個分類點時,我將分別對x和y進行分類。我身上的某些東西告訴我這是不正確的。 請諮詢我如何呈現在x,y值作爲一個數據元素。

    1熱度

    1回答

    還是flann可以嗎?我不是最有經驗的編碼器,我也可能只是被忽視的東西很基本的 問題(C++,OpenCV的2.4.3。): 我有兩個點雲,並要計算位移圖。我嘗試使用flann .lib從第二個雲點獲取第一個雲中點的最近鄰點,並使用它們和距離來計算位移矢量(s)。 我走到這一步,是這樣的: int nn = 1; cv::Mat MyIndex(data1.size(),3,CV_64FC1);

    3熱度

    1回答

    我正在使用R進行文本挖掘中的術語表。我們的任務是猜測文章的語調(正面/負面)。文章存儲在相應的文件夾中。我需要創建一個分類系統,通過訓練樣本學習。 我重用了http://www.youtube.com/watch?v=j1V2McKbkLo的代碼 除最後一行外的所有代碼都已成功執行。以下是代碼。 tone<- c("Positive", "Negative") folderpath <- "C:

    4熱度

    3回答

    我有兩組點A和B。 我想找到的所有點在乙在一定範圍ř到甲,其中a點b在乙被說成是在範圍之內ř到A內該如果至少有一個點aA其(歐幾里德)距離爲b等於或小於r。這兩組點都是連貫的一組點。它們是從兩個非重疊對象的體素位置生成的。 在1D這個問題相當簡單:內乙 [分鐘(一個) - [R MAX(一個)+ [R]的所有點 但我在3D。 這樣做的最好方法是什麼? 我目前,使用範圍內的一些KNN算法(即MATL

    2熱度

    2回答

    是否有任何關於k-NN搜索問題的文章,對於像10k-100k這樣的真正大量的維度? 大多數測試真實世界數據的文章都以10-50個模糊進行操作,少數文章的操作數爲100-500。 在我的情況下,在〜100k特徵維中有〜10^9個點,並且沒有辦法有效地減少維數。 UPD .: 目前我們正試圖修改和實現VP樹,但是足夠清楚的是,任何有關此維度的樹結構都無法正常工作。 第二種方法是LSH,但根據數據分佈的

    0熱度

    1回答

    我有72個觀測數據框(df)和592變量與一個因子類變量(總共593個變量,即dim(df)= 72 593)。我正在尋找一種方法來選擇7個變量(包括類變量),使用Receiver Operating Characteristics(ROC)來選擇最佳k值。我想用這七個變量用圖形模型進行分析,但我不想隨意選擇變量。我希望我的選擇在統計上是合理的。 我想看到的是我的結果是一樣的東西: 變量V23,V

    2熱度

    1回答

    我要求您提供有關分類問題的輸入和/或幫助。如果任何人有任何我可以閱讀的參考資料,以幫助我更好地解決我的問題。 我有一個分類問題的四個離散和很好分離的類。然而我的輸入是連續的並且具有很高的頻率(50Hz),因爲它是一個實時問題。 圓圈代表的類的集羣,藍線的決定邊界和第5類等於(中性/靜止什麼也不做類)。這個班是被拒絕的班。然而,問題在於,當我從一個班級轉到另一個班級時,我在轉換動作中激活了很多誤報,

    0熱度

    2回答

    我有13萬SIFT描述。我正在使用Opencv的flann模塊構建分層Kmeans索引。這個我想這些量化描述130000後(會更晚一些量化)。我正在使用flann的knnsearch方法來做到這一點。但這種方法的結果是奇怪的。對於每個描述符,它顯示的最近索引是描述符本身的索引。然而,應當顯示這將是海康樹的葉子的一個最近的簇的簇ID。 我應該嘗試K = 2 下面的代碼片段 - (!它不給集羣-ID)