similarity

    2熱度

    2回答

    我是新來的「搜索」MySQL中,我有一些任務,我不知道如何實現他們的最佳方式。 我在我的數據庫中有以下的MySQL表。 delimiter $$ CREATE TABLE `authors` ( `id` int(11) NOT NULL, `name` varchar(100) COLLATE utf8_unicode_ci NOT NULL, `count` i

    0熱度

    1回答

    我有客戶數據庫,他們具有某些屬性和客戶類型。屬性的集合可能會有所不同(它們確實來自有限集合),而當我查看未知類型的新客戶並給定屬性時,我想確定他/他屬於哪種類型。例如,假設我在DB有這些客戶已經, Customer | Type | Attributes 1 A 44,32,5,'X' 2 A 3,32,66,'A' 3 B 6,32,'A', 'B' 4 C

    0熱度

    1回答

    我試圖通過關聯在數據庫中找到類似的文章。因此,我將文本分割成單詞列,然後刪除經常使用的單詞(文章,代詞等),然後將兩個文本與皮爾森係數函數進行比較。對於某些文本是有效的,但對於其他文本則不太好(文本較大的文本具有較高的係數)。 有人可以建議一個很好的方法來找到相關的文本?

    1熱度

    2回答

    我使用中科院的中文Wordnet。它是Wordnet 1.6的翻譯。不幸的是,它不是免費的,必須購買,手冊基本上是指Wordnet的手冊。我想弄清楚的是如何比較兩個詞之間的相似性。我想這是用WordNetSynsetOffset完成的,但我無法在Wordnet網站上找到任何內容或有關如何使用它來比較兩個單詞的文檔。至於實際的算法,我想這是一個良好的開端http://marimba.d.umn.ed

    2熱度

    1回答

    這是堆棧溢出和在此平臺上運行的其他站點做得很好的事情之一。只要您嘗試創建新問題,就會顯示一個顯示其他類似問題的小窗口。這是如何完成的?可以用什麼技術來實現這一點? Lucene,獅身人面像,...?

    0熱度

    1回答

    我們目前正在做一個抄襲檢測兩個文本文檔的項目。我們必須比較兩份提交的文件並提供比較結果。爲此我想並排展示這兩個文檔,並突出顯示GUI中文檔之間的相似點。我使用各種算法來獲得兩個文檔(如向量空間和瓦片雲算法)之間的相似度分數。但他們不提供具有相似性的部分,我必須將它們呈現給圖形界面中出現相似性的用戶。 感謝名單 Nuwan

    30熱度

    4回答

    如果我有mysql中兩個字符串: @a="Welcome to Stack Overflow" @b=" Hello to stack overflow"; 有沒有辦法讓使用MYSQL這兩個字符串之間的相似性百分比是多少? 這裏例如3個單詞是相似的,因此相似性應該類似於: count(@a和@b之間的相似詞)/(count(@a)+ count(@b) - count(intersect

    7熱度

    3回答

    我需要在基於Java的應用程序中使用Wordnet。 我想: 搜索同義詞集同義詞集之間 查找相似/關聯 我的應用程序使用RDF圖,我知道有SPARQL端點與WORDNET,但我猜最好有一個本地數據集副本,因爲它不太大。 我發現下面的罐子: 總庫 - JAWShttp://lyle.smu.edu/~tspell/jaws/index.html 總庫 - JWNLhttp://sourceforge

    0熱度

    3回答

    這個問題對我來說是一個挑戰,我的朋友不能告訴我如何去做,但他是一個很好的程序員(我認爲) 。 用戶可以放入數據庫語句。當用戶放置一個句子時,它被保存在sentences表中。 接下來,將句子拆分爲單詞,將單詞的每個單詞索引保存到具有拆分句子的標識的表tags中。 最後,這個詞的每個soundax被放入weights表中,如果有相同的soundex,函數將這個soundex的counter加1。 (

    0熱度

    1回答

    我製作了一個構建3個圖形(弧和節點)的程序。 這些圖是基於1和0的二維數組構建的。 第一張圖是其他兩張將要比較的理想圖。如果有兩種圖形之間比較相似性的方式,即我有兩種方法比較相似,即圖2中有多少個頂點與圖1中的頂點相似。 替代問題: 圖形是基於二維數組1和0所以如果有一種方法比較圖1的二維數組和圖2的數組,而不是這會解決我的問題。 我不指望你們都把代碼放好,但我只是想知道是否有一種方法可以做到這一