similarity

    2熱度

    4回答

    我有一個履帶式項目,每天都會存儲來自7家不同新聞機構的體育數據。它每天存儲約1200項體育新聞。 我想將最近兩天的新聞分類爲子類別。因此,每隔兩天我就會有大約2400條新聞,這些新聞正是這些日子裏的話題,而且他們的許多話題都在講述同一個事件。例如: 例如: 70消息正在談論布拉德凱瑟洛夫斯基500英里賽車。 120新聞正在談論美國游泳運動員Nyad開始游泳。 28新都在談論曼聯和曼城之間的比賽。

    2熱度

    1回答

    在一個陣列算法遞歸雖然這聽起來像一個數學/ CS的問題,我相信有人在那裏將能幫助我與此有關。 我有兩個表,similarityTable和物品。項目表包含以下數據: itemID itemName ------ ----- 1 A 2 B 3 C 4 D 5 E 和similarityTable: item1 item2 ----- ---

    -1熱度

    1回答

    我是JSoup的新手。我不知道在JSoup中有任何比較相似性2表(或2個元素)的方法。 具體而言,假設我有以下2個表: </table> <table> <tr> <td>1</td> <td>2</td> <td>3</td> </tr> <tr> <td>4</td> <td>5</td> <td>6</td> </tr> </table> 所以,我怎麼確定2個

    0熱度

    1回答

    我有一個django博客,我正在爲它編寫一個簡單的類似文本算法。下面的代碼是我用我的博客數據庫的副本測試的代碼。 (注:代碼最初是在土耳其,我改變變量名,以英語爲方便起見,因此,事情可能看起來怪怪的。) # -*- coding:utf-8 -*- from django.utils.html import strip_tags import os import sys import ma

    1熱度

    1回答

    我想在集合中的長查詢和文檔之間獲得餘弦相似度。我使用Lucence來爲收集索引並提交查詢來檢索文檔。 但是,我收到以下錯誤的一些查詢。 "Caused by: org.apache.lucene.search.BooleanQuery$TooManyClauses: maxClauseCount is set to 1024" 我複製了一些在查詢中的術語來提高他們的體重。但似乎lucene只是

    1熱度

    1回答

    用於比較android中的兩個圖像的最佳(最簡單的方式)的建議。 第一張圖片在我的SD卡中。 第二張圖片是在android中使用Camera拍攝的。 如何衡量這兩張圖片之間的百分比相似度? 非常感謝。

    1熱度

    1回答

    我有一個項目(針對該問題的文章)的數據庫。 我想要做的是,我想要拉出與特定項目相似的X個項目,基於兩件事情 - 標題,這是文章的標題和標籤,它們位於另一個項目中表。 的結構如下(相關字段只): 表:文章 字段:條款ArticleID,標題 表:標籤 字段:標籤識別,標記文本 表:articletag Fields:tagid,articleid 這樣做的最佳方法是什麼?

    4熱度

    2回答

    想象一下,我擁有來自不同論壇網站的大量線索和帖子(大約10.000.000條記錄)的龐大數據庫,其中包括幾個用作我的lucene文檔的子論壇。 現在我正在嘗試根據其中使用的術語計算每個帖子的名爲「OnTopicness」的功能。實際上,這個特徵不僅僅是兩個文檔向量之間的簡單餘弦相似度,它們將被存儲在數據庫中,因此每個文章只能計算一次。 : 論壇 - OnTopicness:我的文章和虛擬 文件中指

    3熱度

    1回答

    Hy guys! 我有3個表: topics (id*, title, body) tags (id*,name) topic_tags (topic_id,tag_id) 每個主題有一些標籤。我想根據標籤(而不是基於標題和正文的主題)找到另一個「最相關」的主題。 如果更常見的標籤有2個主題,它們更相關。我想通過相似性(=​​通用標籤的數量)以某種方式排列結果。 你有什麼建議?

    1熱度

    1回答

    我有帶有兩個向路徑的有向圖。 我想要一個算法來確定兩個路徑之間的相似性。 This post提到使用Levenshtein distance來確定近似相似。我也意識到Hamming distance使用了一個類似的指標。 我的問題是: 你是如何處理在兩個路徑平行於對方的情況。也就是說,如果這兩條路徑沒有類似的節點,但它們會被認爲是「相似的」,因爲它們的路徑沿着相互接近的相同方向傳播。 感謝