similarity

    -1熱度

    1回答

    目前我正在研究KNN分類,我在我的數據集中有分類變量和連續變量。所以我決定用Gower的距離作爲KNN的相似度量。但是對於KNN分類,高爾的距離在Weka中是不可用的。有沒有辦法使用weka將Gower的距離用於KNN?如果可能的話,我該如何實現呢?

    0熱度

    1回答

    用於測量R中執行時間的哪種方法與C++中的方法clock()最相似? 我使用sys.time()。 如果我可以比較C++編程語言與R的執行時間,你認爲如何?

    0熱度

    1回答

    考慮以下基礎: basis = "Each word of the text is converted as follows: move any consonant (or consonant cluster) that appears at the start of the word to the end, then append ay." 和下面的話: words = "word, tex

    2熱度

    1回答

    我想計算兩個列表元素的點互信息分數。 比方說,我們有 ListA = "Hi there, This is only a test message. Please enjoy the weather in the park." ListB = "work, bank, tree, weather, sun" 我怎樣才能再計算所有對的PMI分數(工作,嗨),(工作,有),(工作,此).....

    0熱度

    1回答

    我想了解在Gensim的實現中word2vec和doc2vec向量之間的關係。在我的應用程序中,我使用相同的標籤(主題)標記多個文檔,我正在使用dbow_words = 1在我的語料庫上訓練doc2vec模型,以便訓練單詞向量。我已經能夠以這種方式獲得單詞和文檔向量之間的相似性,這確實具有很大的意義 例如,獲取的文檔標籤類似於字處理 doc2vec_model.docvecs.most_simil

    1熱度

    1回答

    我已經在csv文件中存儲了包含0到1之間的概率值的o相似度矩陣,我想知道是否有方法將此矩陣導入到Gephi中以便用不同的顏色

    2熱度

    1回答

    我讀了this關於找到三維點的最近鄰居的問題。八叉樹是這種情況下的解決方案。 kd-Tree是小空間(通常小於50尺寸)的解決方案。 對於高維(向量爲幾百個維和幾百萬個點)LSH是解決AKNN(Aproxximate K-NN)問題的流行解決方案,如this question中指出的那樣。 然而,LSH對K-NN解決方案很流行,其中K >> 1。例如,對於基於內容的圖像檢索(CBIR)應用,LSH

    -1熱度

    3回答

    有許多流行的算法根據其發音將英語單詞編碼爲字符串。例如,soundex碼是由單個字母后跟三個數字組成的四字符串。 是否有一種有效的方法來計算0和1之間的相似度分數?

    -1熱度

    3回答

    我有一個列表[ [0], [0,1], [1,2], [3] ],我試圖將類似的元素組合在一起。我需要輸出爲[ [0,1,2], [3] ]。這是將列表中的類似元素分組。有沒有一個首選的方法來做到這一點?

    0熱度

    2回答

    Hye, 我想計算一個相似性指標,以便當行'simialr時得到+1,而當它們不是時則爲-1。 dataR<- read.table(text=' echant espece ech1 esp1 ech2 esp2 ech3 esp2 ech4 esp3 ech5 esp3 ech6 esp4 ech7 esp4',