2008-10-23 16 views
0

我使用Lawrence Philips Double-Metaphone算法取得了巨大成功,但我發現了一些組合的奇怪「意想不到的結果」。Double-metaphone error

是否有其他人對算法的其他部分進行了添加或更改,他們不介意共享,或者只是他們發現的組合無法按預期工作。

例如。我之間有問題:

  • Peashill和布什利。 (均配以PXL)
  • Rockliffe公司和羅克利夫(RKLF和RKKL)
+0

您的代碼中可能存在一些bug我相信Bushley應該是BXL。我認爲最後兩個是正確的。 – 2011-01-14 02:26:42

+2

@JonathanWood - 在雙倍的Metaphone B中投入P,而(我相信)原來的Metaphone並非如此。所以布什利的PXL在DM中是正確的。 – APC 2012-12-20 11:00:38

回答

5

所有探測法,音位和變異方案偶爾要給一點效果都沒有的與你所期望的。這是不可避免的 - 它們可以被視爲具有特殊信息保存屬性的或多或少簡單的哈希算法,並且有時會在您不希望的時候產生衝突,並且有時會在您不希望時產生差異。

改善事物的一種可能方式是使用'同義詞環'。這基本上產生了應被視爲同義詞的單詞列表,與拼寫無關。我在名稱匹配的情況下遇到了它們。例如,在Chaudri 變體包括:

CHAUDARY CHAUDERI CHAUDERY CHAUDHARY CHAUDHERI CHAUDHERY CHAUDHRI CHAUDHRY 喬赫裏 喬杜裏 CHAUDHY 紹德雷 CHAUDRI 喬德里 CHAUDURI CHAWDHARY CHAWDHRY CHAWDHURY CHDRY CHODARY CHODHARI CHODHOURY CHODHRY CHODREY CHODRY CHODURY CHOUDARI CHOUDARY CHOUDERY CHOUDHARI CHOUDHARY CHOUDHERY CHOUDHOURY CHOUDHRI 喬德里 CHOUDHURI 喬杜裏 CHOUDREY CHOUDRI CHOUDRY CHOUDURY CHOUWDHRY CHOWDARI CHOWDARY CHOWDHARY CHOWDHERY CHOWDHRI 喬杜裏 CHOWDHURI CHOWDHURRYY CHOWDHURY CHOWDORY CHOWDRAY CHOWDREY CHOWDRI CHOWDRURY CHOWDRY CHOWDURI CHOWDURY CHUDARY CHUDHRY CHUDORY COWDHURY

-1

定期音位正在返回Peashill之間的差和布什利

Peashill PXL Bushley BXL