2016-07-06 45 views
2

我們在TD 14版本上,我來自Netezza/Postgre(Redshift)背景。我被要求從審計日誌中提取一個登錄數據,以找出相同的IP提交類似的用戶名和小的變化的記錄/交易。如Samir - > Samr - > Amir等 捕獲網絡釣魚活動。 在POstgres中,我們有像'%'這樣的模糊字符串函數,例如ColA%ColB(其中%操作符相當於相似) Soundex,Metaphone,levenshtein等 然而,在Teradata中我剛剛遇到或者我只能找到Soundex 。 Teradata 14版本中是否有這樣的內置函數/方法功能來實現上述字符串逼近。Teradata SQL根據近似字符串匹配提取記錄

回答

0

Teradata 14.x通過EDITDISTANCE()函數和通過NGRAM()函數的n-gram模式匹配支持Damerau-Levenshtein距離算法。

您可以找到有關EDITDISTANCE功能here和NGRAM()功能here的信息。