similarity

2熱度

2回答

我創建了此功能將數字轉換爲單詞。以及我如何使用這個我的虛詞轉換成數字：簡單的函數代碼： $array = array("1"=>"ЯК","2"=>"ДУ","3"=>"СЕ","4"=>"ЧОР","5"=>"ПАНҶ","6"=>"ШАШ","7"=>"ҲАФТ","8"=>"ХАШТ","9"=>"НӮҲ","0"=>"НОЛ","10"=>"ДАҲ","20"=>"БИСТ","30"=

3熱度

1回答

Elasticsearch單詞相似性

單詞相似性檢查有哪些選項？請考慮以下情況：我們有文檔，其中字段電子郵件，存在。在添加新文檔時，我們要檢查是否有任何文檔的電子郵件與新的文檔相似，但有一些相似性約束 - 例如80％的匹配。是否有任何特定的內置查詢可以使用？

0熱度

2回答

如何查找出現在數組的每個元素中的最長子字符串？

我有一些作者的文本集合。每位作者在其所有文本中都有獨特的簽名或鏈接。示例作者1： $texts=['sdsadsad daSDA DDASd asd aSD Sd dA SD ASD sadasdasds sadasd @jhsad.sadas.com sdsdADSA sada', 'KDJKLFFD GFDGFDHGF GFHGFDHGFH GFHFGH Lklfgfd gdfsgfd

0熱度

1回答

如何通過MinHash計算兩個文本與兩個包的Jaccard相似度的相似度？

我有以下兩個文本： text0 =「AAAAAAAAAAAA」; text1 =「AAAAABAAAAAA」; 我使用4-ingle。因此，text0 = {AAAA}，text1 = {AAAA，AAAB，AABA，ABAA，BAAA}。然後，Jaccard相似度是sim = 1/5 = 0.2。我不想要這個結果。因爲這兩個文本似乎有很高的相似性。我想用袋子相似如下： text0 = {A

-2熱度

1回答

k均值實現混合變量在數據庫級

我有不同的數據類型的列（如列：產品編號，名稱，大小，顏色，等級，部門等）的表，因爲不是所有列是數字的，我怎麼能聚集同類產品一起。數據位於Netezza中，爲了快速處理，我只想在數據量巨大時（大約200萬行）在數據庫端執行此操作。我試圖在R中實現Gower的相似性，但它需要很長時間。有沒有我可以在netezza上使用的UDF？ dput（頭（PROD））結構（列表（Product_key = C

0熱度

2回答

使用語義相似度的文本摘要

我目前正在研究NLP項目，文本摘要，是否可以通過檢查相似性beetwen句子來總結文本？如果可能的話，如何？或者爲什麼不呢？感謝

0熱度

1回答

從原始卡片分類數據創建相似矩陣

我有一個來自在線卡片分類活動的數據集。參與者獲得了隨機子卡（來自更大的一組），並被要求創建他們感覺彼此相似的卡組。參與者可以根據自己的喜好創建任意數量的團體，並根據自己的意願命名團體。示例數據集中是這樣的： Data <- structure(list(Subject = c(1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 2L,

0熱度

1回答

比較Neo4j中的兩個圖

我是Neo4j的新手，我試圖比較Neo4j中的兩個圖。我的第一個問題是如何在Neo4j上創建兩個不同的圖。我創建瞭如下圖，就像兩個不連貫的圖。 Neo4j graph 這是我們可以在Neo4j的兩幅圖進行比較，或有其它方式的最佳途徑？我的第二個問題是基於我的要求來找到兩個圖中的公共頂點和公共邊。如何獲取這些信息？我使用Java連接到Neo4j來創建和運行Cypher查詢。在這個平臺上有一些關於

0熱度

1回答

Python字符串匹配完全等於Postgresql相似函數

我一直在使用PostgreSQL中pg_trgm模塊的相似性功能，現在我正在Python中搜索類似於相似度的單詞相似性函數。我在Python中找到了很多方法，例如difflib，nltk，但這些方法都沒有產生類似於PostgreSQL相似函數的結果。我一直在使用這段代碼進行單詞匹配，但結果與PostgreSQL相似度函數的結果大不相同。這些結果是否比PostgreSQL的相似性功能好？有沒有什麼

1熱度

3回答

部分未知矢量的最近鄰居

假設我們有人員列表，並希望找到像人X這樣的人。特徵向量有3個項目[weight, height, age]，我們列表中有3個人。請注意，我們不知道人的身高C。 A: [70kg, 170cm, 60y] B: [60kg, 169cm, 50y] C: [60kg, ?, 50y] 什麼是最好的方式找人最接近某甲？我的猜測計算一下平均高度值，並用它來代替未知值。因此，假設我們計算