2009-06-25 62 views
2

我需要開發一個應用程序來索引幾個文本,我需要在這些文本中搜索人名。問題是,當一個人的正確名稱是「格雷戈裏·傑克遜少年」,裏面的文字,名字可能我寫爲:
- 格雷格·傑克遜JR
- Gegory傑克遜JR
- 格雷戈裏·傑克遜
- 格雷戈裏Ĵ 。初級
我計劃在每晚的基礎上對文本進行索引,並構建數據庫索引以加快搜索速度。我想推薦好的書籍和/或關於這個主題的好文章。
謝謝在文本中識別拼寫錯誤的名字的算法

+0

你的問題是錯誤的措詞。這些例子並不表示拼寫錯誤,而是寫入全名的形式發生變化。而且,我很好奇,你的搜索是否希望參照這個例子來匹配「兒子」這樣的詞? – nik 2009-06-25 14:23:15

+0

其實,其中一個名字也可能拼寫錯誤。我不需要像大三和兒子這樣的同義詞。 謝謝 – Pascal 2009-06-25 14:30:14

+0

你有沒有發現任何要做到這一點? – 2012-02-16 01:20:14

回答

2

你的問題是不正確的措辭。這些例子並不表示拼寫錯誤,而是寫入全名的形式發生變化。

而且,

好了,讀您的意見建議你不想冒險進入這一點。

1

備案。使用貝葉斯過濾器。您可以使用機械卡車來初始化您的算法。

相關問題