我需要開發一個應用程序來索引幾個文本,我需要在這些文本中搜索人名。問題是,當一個人的正確名稱是「格雷戈裏·傑克遜少年」,裏面的文字,名字可能我寫爲:
- 格雷格·傑克遜JR
- Gegory傑克遜JR
- 格雷戈裏·傑克遜
- 格雷戈裏Ĵ 。初級
我計劃在每晚的基礎上對文本進行索引,並構建數據庫索引以加快搜索速度。我想推薦好的書籍和/或關於這個主題的好文章。
謝謝在文本中識別拼寫錯誤的名字的算法
2
A
回答
2
2
你的問題是不正確的措辭。這些例子並不表示拼寫錯誤,而是寫入全名的形式發生變化。
而且,
- 將搜索期望匹配的話就像兒子參照的例子嗎?
- 它會期望match bob when looking for a name called Robert?
好了,讀您的意見建議你不想冒險進入這一點。
1
備案。使用貝葉斯過濾器。您可以使用機械卡車來初始化您的算法。
相關問題
- 1. 不使用字典來識別拼寫錯誤的算法類是什麼?
- 2. 如何拼寫excel中的文本,即使拼寫錯誤
- 3. VBA - 識別電子郵件域中的拼寫錯誤
- 4. 谷歌搜索算法拼寫錯誤的搜索關鍵字
- 5. 書寫方法,拼寫單詞backwords和識別迴文數
- 6. Vim在拼寫時不識別德語文本
- 7. 在PyCharm中刪除文件名的拼寫檢查錯誤
- 8. 帶拼寫糾錯算法的拼寫檢查器
- 9. 算法查找拼寫出的數字
- 10. 在Java中拼寫我的名字?
- 11. 在python中識別和計算文本
- 12. 名字拼寫的變化
- 13. Python中支持什麼拼寫錯誤/拼寫錯誤?
- 14. 文本,基於字符串的和絃識別算法?
- 15. 如何計算使用SQL查詢拼寫錯誤的字段?
- 16. Java錯誤無法識別的錯誤
- 17. android的簽名識別算法
- 18. 字符識別(OCR算法)
- 19. 文本輸入中的自動拼寫錯誤
- 20. HipChat:如何用斜線修正文本中的拼寫錯誤?
- 21. 錯誤:無法識別COPY文件簽名 - PostgreSQL的9.6
- 22. cakephp創建拼寫錯誤的模型類,它的文件名
- 23. Vim使用錯誤的拼寫文件?
- 24. 無法識別的字體家族'Ionicons'錯誤 - 本機基地
- 25. F#拼寫錯誤
- 26. 「svn無法識別」PowerShell中的錯誤
- 27. 無法識別HTML中的錯誤
- 28. java中未識別錯誤的方法
- 29. 文件無法識別:文件格式無法識別的錯誤使用C
- 30. 有沒有一種很好的方法來識別一個單詞,即使它在JavaScript中拼寫錯誤?
你的問題是錯誤的措詞。這些例子並不表示拼寫錯誤,而是寫入全名的形式發生變化。而且,我很好奇,你的搜索是否希望參照這個例子來匹配「兒子」這樣的詞? – nik 2009-06-25 14:23:15
其實,其中一個名字也可能拼寫錯誤。我不需要像大三和兒子這樣的同義詞。 謝謝 – Pascal 2009-06-25 14:30:14
你有沒有發現任何要做到這一點? – 2012-02-16 01:20:14