我正在使用以下查詢來檢測數據庫中的重複項。使用LINQ/C#查詢檢測「接近重複項」
使用LINQ連接不能很好地工作,因爲X公司也可能被列爲CompanyX,因此我想修改它以檢測「接近重複」。
var results = result
.GroupBy(c => new {c.CompanyName})
.Select(g => new CompanyGridViewModel
{
LeadId = g.First().LeadId,
Qty = g.Count(),
CompanyName = g.Key.CompanyName,
}).ToList();
有人可以提出一種方法,我可以更好地控制比較嗎?通過的IEqualityComparer也許(雖然我不完全知道如何將在此情況下工作)
我的主要目標是:
- 要列出所有重複的一個子集的第一條記錄(或「near duplicates」)
- 要在字段和文本比較上有一定的靈活性,我使用我的重複項。
我認爲這裏的主要問題是你在尋找**重複的**不同排列(例如'公司X','公司X','公司X')或者你在尋找** SOUNDEX ** ? –
@BigM我正在尋找不同的排列。謝謝。 – Nick