2015-10-01 84 views
0

具有不同ID的出現尋找公司我有2列在我的數據:在MS Excel

  • A - 每家公司的唯一的ID。
  • B - 與各自ID對應的公司名稱。

這種類型的數據擴展到13,000行。例如:

Col A Col B 
12  Google Inc 
12  The Google 
14  Google 
18  Amazon 
18  Amazon 
21  Amazon INC 
18  Amazon 
... 

從上面的例子可以看出,問題在於有時公司會出現不同的ID。此外,雖然在所有3種情況下,公司仍然是一樣的,但事實是他們的措詞不同,因此很難做到完全匹配。

我在這個鍛鍊目標是雙重的:

  • 找哪家公司有不同的標識顯示。
  • 確定發生這種情況的行。

通過所有13000行會很麻煩。什麼Excel公式可以做到這一點?

回答

0

您可以使用數據透視表來計算每個名字有多少重複了。

我也要:

訂購列表中列B. 添加在C列的公式,該公式一行上一行進行比較。

例如,考慮第5行的公式:

=IF(B4=B5,"Identical","Different") 

你可以建立在例如更多的智能之名比較第5行的第一個字,看它是否是行4名。例如

=IF( iserror( find( LEFT(B5,FIND(" ",B5,1)-1) ,B4,1) ) 
    ,"" 
    ,"Similar") 

您可以在上述纖維束組合成單個功能,或者可以在不同的列同時使用(這是更容易)

第2部分:

的數據必須由B列進行排序!

因此,使用上述的邏輯比較,你應該與此式

= find( LEFT(B5,FIND(" ",B5,1)-1) ,B4,1) 

然後添加另一列添加另一列(列F)的ID(欄G)

=IF(B4=B5 
    , B5 
    , IF( iserror(F5) ) 
     ,"" 
     , F5 ) 
    ) 

這導致G列中的值是相同的公司名稱或具有匹配名稱的公司的第一個詞。

然後,您可以添加另一列(H列),該行的ID與相同ID的

=IF(F4=F5 
    , IF(A4<>A5, "Different IDS, "Ok IDs") 
    , "First row in company group" 
    ) 
+0

比較謝謝哈維。但是,我的數據不是均勻分佈的,即每個公司出現的行的範圍是1到5.您提到的公式可能只查看前2或3行。有沒有辦法認爲我可以修改公式,以便我的公司名稱與完整的13000行數組進行部分匹配,並確定公司ID不同的行? 我被要求不要使用數據透視表... 謝謝! – adam1990

+0

請參閱我的答案的第2部分。我不明白你如何表述「然而,我的數據不是均勻分佈的,即每個公司出現的行的範圍是從1到5。」停止我從工作中提出的解決方案?請解釋更多的問題 - 如果我的解決方案不起作用。 – HarveyFrench