similarity

    0熱度

    1回答

    我使用Emgu CV的SURF功能識別圖像中的類似對象。 繪製圖像,顯示在兩幅圖像中找到的所有關鍵點。問題是在圖像中看到類似的點。 如何將這些匹配點保存在數據庫中?

    0熱度

    1回答

    我有一個數據幀df它看起來像這樣: 2a 2b 2c 2d 2e 2f 2a 1 0.5 0.7 0.2 0.1 0.3 2b 0.5 1 0.6 0.4 0.3 0.4 2c 0.7 0.6 1 0.1 0.4 0.2 2d 0.2 0.4 0.1 1 0.8 0.7 2e 0.1 0.3 0.4 0.8 1 0.8 2f 0.3 0.4 0.2 0.7 0.8 1 現在: i

    0熱度

    3回答

    我有一個帶有字符串的列表,我想用Levenstein算法(或任何其他)來檢查我試圖插入數據庫的新記錄是否與我已經在數據庫中相似。算法應該通過列表中的每一個項目,並與我想要插入的項目進行比較。如果相似性很高,則打破循環並返回。 我已經開始,但不知道如果我是正確的方式。如何從while循環中的foreach循環中打破? public static bool IsSimilarValuesExist(s

    0熱度

    1回答

    我試圖讓兩個光柵之間的(DIS)的相似性與emd2d的定量估計(從emdist庫版本。0.3-1)。 下面的代碼運行於小矩陣(〜35x35),但我的柵格大得多(〜5000x3000)和我得到一個存儲器錯誤: 錯誤EMDR(A,B,DIST = DIST。 ..): 無法在emdist 這裏存儲(-1608.8 MB)是一個示例代碼來說明問題: #test case: library(emdist

    1熱度

    1回答

    我正在檢查Simhash模塊(https://github.com/leonsim/simhash)。 我認爲Simhash(「String」)。distance(Simhash(「Another string」))是兩個字符串之間的漢明距離。現在,我不知道我的理解是「完全get_features(string)方法,如圖(https://leons.im/posts/a-python-imple

    2熱度

    1回答

    我在想如何在Python中的FFT圖中檢測新的峯值。 假設我有這個簡單的情節: 而且我想自動測量嘈雜信號中的「相似性」或峯值位置,我試圖使用餘弦相似性,但是我的真實信號太吵了,而且偶數如果我給信號增加一個新的峯值,我會一直得到0.9的餘弦值,因爲它只有一個峯值。 這是我的真實信號的一個例子,我也有問題,我的信號可以在措施內傳遞,所以我無法獲得穩定的頻率數組,他們可以在+/- 100 Hz的窗口內:

    0熱度

    1回答

    我正在進行潛在語義分析,我試圖從2個文檔中獲得相似度。我在Python上運行我的潛在語義分析代碼,當我運行它時,我得到: Here are the singular values [ 0.7376057 0.4596623 0.25422212] Here are the first 3 columns of the U matrix [[ 0.98465137 -0.172792 -0.0

    1熱度

    1回答

    我有些麻煩理解什麼似乎很容易計算。 我知道Jaccard係數是交點(A,B)/聯合(A,B),那麼這怎麼是真的? > sets::gset_similarity(c("1","2"), c("1","2","3"), "Jaccard") [1] 1 是不是2/3?

    2熱度

    2回答

    我已經閱讀this question,但不幸的是它沒有幫助。 什麼我不明白的是我們做當我們瞭解到這桶分配給我們的高維空間查詢向量q:假設使用我們的局部性敏感家庭功能h_1,h_2,...,h_n我們已經翻譯q到低維集(n維度)哈希碼c。 然後c是分配給q的桶的索引,並且在哪裏(希望)也被分配了它的最近鄰居,假設有100個向量。 現在,我們爲了找到做q的NN是計算q和只有這100個向量之間的距離,是

    6熱度

    1回答

    使用gensim,我想計算文檔列表中的相似度。這個庫在處理我得到的數據量方面非常出色。這些文件全部縮減爲時間戳,並且我有一個功能time_similarity來比較它們。然而,gensim使用餘弦相似度。 我想知道是否有人曾經嘗試過或有過不同的解決方案。