textmatching

    2熱度

    1回答

    對varchar中發生的varchar進行計數的最佳方式是什麼? 我寧願不循環瀏覽文本以找到某些組合。 這個選擇只能找到第一 SELECT CASE WHEN CHARINDEX('!','HOW MANY TIMES IS ! IN THIS TEXT ? THIS IS MY QUESTION !') > 0 THEN 1 ELSE 0 END 返回1 我需要一種方法來尋找匹配 TABLE

    0熱度

    1回答

    我執行從我的MySQL數據庫將一組名稱,並從一個CSV文件一組字符串之間一個非常簡單的文本匹配的文本匹配。在進行實際的比較之前,我運行帶選項數組的preg_replace來標準化字符串。重要的替代之一是將不規則縮寫改爲常規全文。但我似乎無法捕捉像「公司」這樣的縮寫。和「Inc」,「Corp.」和「公司」可能會或可能不會有後期。 下面是代碼: $patterns = array(); $patte

    13熱度

    2回答

    我正在尋找一個Java/Scala庫,可以接受用戶查詢和文本,並在有匹配或不匹配的情況下返回。 我正在處理信息流,即:Twitter Stream,並且無法使用批處理過程,因此我需要實時評估每條推文,而不是通過Lucene RAMDisk對其進行索引並稍後查詢。 這是可能的使用ANTLR創建一個解析器/詞法分析器,但這是常見的用法,我不相信沒有人創建一個lib之前。 從TextQuery Ruby

    3熱度

    7回答

    我有一個個人數據表的幾個來源,像這樣: SOURCE 1 ID, FIRST_NAME, LAST_NAME, FIELD1, ... 1, jhon, gates ... SOURCE 2 ID, FIRST_NAME, LAST_NAME, ANOTHER_FIELD1, ... 1, jon, gate ... SOURCE 3 ID, FIRST_NAME, LAST_N

    5熱度

    7回答

    我們有一個包含公司名稱,地址和聯繫人姓名(以及其他)的SQL Server表。 我們經常從要求我們匹配對這個表以外的來源接收數據文件。不幸的是,由於數據來自完全不同的系統,所以數據略有不同。例如,我們有「123 E. Main St.」我們收到「東大街123號」。另一個例子,我們有「Acme,LLC」,文件包含「Acme Inc.」。另一個原因是,我們有「埃德·史密斯」,他們有「愛德華·史密斯」

    0熱度

    1回答

    我有一個包含一些數據的文本文件。現在我有其他文本文件中的關鍵字列表。 現在我想要做的事情,以便我可以找出第二個文本文件中有多少關鍵字在第一個文件中。 我不是一個很大的程序員,那麼,有沒有簡單的方法來做到這一點

    2熱度

    1回答

    我有一組字符串以及它們的座標和矩形邊界int兩個相似的頁面。這些字符串有三種可能的方式。 (i)字符串可以移動到頁面上的新位置。 (ii)一個字符串在相同的位置,但它被修改。說(abc - > abd或ABC) (iii)(i)和(ii)的組合。 (iv)可能缺少一個字符串。 我試圖使用局部敏感哈希,但無法找到一個很好的哈希函數。任何人都可以請建議我一個很好的散列函數或其他算法來解決這個問題。在此

    1熱度

    6回答

    如何將文本文件(或XML文件)表示爲整個字符串,並在其中搜索(或匹配)特定的字符串? 我已經創建了一個BufferedReader對象: BufferedReader input = new BufferedReader(new FileReader(aFile)); ,然後我曾嘗試使用掃描儀類的選項來指定不同的分隔符,就像這樣: //Scanner scantext = new Scanne