similarity

-1熱度

1回答

目前我正在研究KNN分類，我在我的數據集中有分類變量和連續變量。所以我決定用Gower的距離作爲KNN的相似度量。但是對於KNN分類，高爾的距離在Weka中是不可用的。有沒有辦法使用weka將Gower的距離用於KNN？如果可能的話，我該如何實現呢？

0熱度

1回答

用於測量R和C++中執行時間的類似方法

用於測量R中執行時間的哪種方法與C++中的方法clock（）最相似？我使用sys.time（）。如果我可以比較C++編程語言與R的執行時間，你認爲如何？

0熱度

1回答

計算PMI值使用給定上下文窗口

考慮以下基礎： basis = "Each word of the text is converted as follows: move any consonant (or consonant cluster) that appears at the start of the word to the end, then append ay." 和下面的話： words = "word, tex

2熱度

1回答

兩個列表元素的PMI

我想計算兩個列表元素的點互信息分數。比方說，我們有 ListA = "Hi there, This is only a test message. Please enjoy the weather in the park." ListB = "work, bank, tree, weather, sun" 我怎樣才能再計算所有對的PMI分數（工作，嗨），（工作，有），（工作，此）.....

0熱度

1回答

單詞向量和段落向量查詢

我想了解在Gensim的實現中word2vec和doc2vec向量之間的關係。在我的應用程序中，我使用相同的標籤（主題）標記多個文檔，我正在使用dbow_words = 1在我的語料庫上訓練doc2vec模型，以便訓練單詞向量。我已經能夠以這種方式獲得單詞和文檔向量之間的相似性，這確實具有很大的意義例如，獲取的文檔標籤類似於字處理 doc2vec_model.docvecs.most_simil

1熱度

1回答

如何在Gephi中導入相似性矩陣

我已經在csv文件中存儲了包含0到1之間的概率值的o相似度矩陣，我想知道是否有方法將此矩陣導入到Gephi中以便用不同的顏色

2熱度

1回答

高維空間的近似最近鄰居（A1NN）

我讀了this關於找到三維點的最近鄰居的問題。八叉樹是這種情況下的解決方案。 kd-Tree是小空間（通常小於50尺寸）的解決方案。對於高維（向量爲幾百個維和幾百萬個點）LSH是解決AKNN（Aproxximate K-NN）問題的流行解決方案，如this question中指出的那樣。然而，LSH對K-NN解決方案很流行，其中K >> 1。例如，對於基於內容的圖像檢索（CBIR）應用，LSH

-1熱度

3回答

如何根據自己的發音計算英文單詞之間的相似度分數？

有許多流行的算法根據其發音將英語單詞編碼爲字符串。例如，soundex碼是由單個字母后跟三個數字組成的四字符串。是否有一種有效的方法來計算0和1之間的相似度分數？

-1熱度

3回答

在列表中列出類似的元素

我有一個列表[ [0], [0,1], [1,2], [3] ]，我試圖將類似的元素組合在一起。我需要輸出爲[ [0,1,2], [3] ]。這是將列表中的類似元素分組。有沒有一個首選的方法來做到這一點？

0熱度

2回答

相似度指數：

Hye，我想計算一個相似性指標，以便當行'simialr時得到+1，而當它們不是時則爲-1。 dataR<- read.table(text=' echant espece ech1 esp1 ech2 esp2 ech3 esp2 ech4 esp3 ech5 esp3 ech6 esp4 ech7 esp4',