similarity

    0熱度

    1回答

    我的iPhone應用程序正在使用下面的模式SQLite數據庫: 項目(ID,姓名,...) - >此表包含50條記錄 標籤(ID ,名稱) - >此表包含50個記錄 item_tags(ID,ITEM_ID,TAG_ID,USER_ID) 相似之處(ID,item1_id,item2_id,得分) 項目,標籤,item_tags和相似度表中填充了預定義的記錄,因此不同項目之間的相似度已經離線計算(

    7熱度

    2回答

    有人知道一種簡單的方法來查找Unicode中與ASCII字符相似的字符。一個例子是「CYRILLIC SMALL LETTER DZE(s)」。我想要搜索並替換相似的字符。相似的,我的意思是人類可讀。你看不到它有什麼不同。

    0熱度

    1回答

    我正在尋找一種算法來查找兩個文本文檔是否相似,其中一個文檔包含在另一個文檔中。 我提前感謝你。

    2熱度

    2回答

    我在找一個「壞」散列函數: 我想散列字符串並在一個桶中放入類似的字符串。 你能給我一個暗示從哪裏開始我的研究? 一些方法或算法名稱...

    0熱度

    1回答

    我試圖在PHP中使用代碼adjusted cosine similarity。 我建我的數據是這樣的: $data[UserID][ItemID] = Rating 數據例如: $data[1][1] = 5; $data[1][2] = 3; $data[1][3] = 4; $data[2][1] = 3; $data[2][2] = 2; $data[2][4] = 3;

    2熱度

    3回答

    爲了對我從Lucene獲得的結果執行簡單的聚類算法,我必須計算Lucene中2個文檔之間的餘弦相似度,我還需要能夠製作一個質心文檔來表示每個羣集的質心。 我能想到的就是用tf-idf加權構建我自己的Vector Space模型,使用TermFreqVectors和Overall Term頻率來填充它。 我的問題是:這不是一個有效的方法,有沒有更好的方法來做到這一點? 這感覺有點不清楚,所以如何我可

    3熱度

    5回答

    我正在尋找一個實用程序,它將幫助我查找重複的PDF。問題:我有1000個PDF文件。有些是重複的。由於不同的文件名稱和文件大小的細微差異,它們並不容易檢測到。是否有一個實用程序/算法/庫,可以幫助我找到重複或顯示非常相似(或差異程度)的文件?

    0熱度

    2回答

    我有兩個G729編碼文件,我把它們的pcm版本。我想測量這兩個文件之間的相似度。這些文件是二進制文件,所以如何測量二進制文件之間的相似性,我在C中編寫了一個代碼,它從第一個文件中獲取模式並在第二個文件中搜索相似的代碼,但是我想要有一個相似性度量。我在文獻中搜索了很多,我發現了jaccard和其他人,但仍然無法確定他們哪一個符合我的情況。 提前感謝您的幫助..

    0熱度

    1回答

    我已經做了這一行代碼,使單詞,搜索,增強。 $tekst = preg_replace("/($searchstr)/i", '<span style="color: 8fb842; font-weight: bold;">$1</span>', $tekst); 但我的問題是,當我提出$字符串searchstr = '?';它在$ tekst字符串中的每個字母之間進行設置。 整個腳本是: /

    1熱度

    1回答

    我試圖找到最好的方式來確定一組物品(在這個例子中;在鱷梨食譜配方)是如何相似的所有組的項目(食譜在一個表;鏈接到另一個成分表)。 例如;我有以下的鱷梨食譜: 3鱷梨 1葡萄成熟的西紅柿 1紅洋蔥 3胡椒 1海鹽 1辣椒 我想運行通過這個食譜我所有食譜的表格,以確定是否有另一個類似於它的食譜(基於成分和數量),按照它的相似程度排序。另外,我希望能夠確定它們之間的差異(無論是成分計數差異還是不同成分)