我正在使用python和mysql。這裏是我的代碼使用Difflib從字符串列表中刪除幾乎重複的字符串
cur.execute("SELECT distinct product_type FROM cloth_table")
Product_type_list = cur.fetchall()
現在Product_type_list描述的是這樣
product_type_list =['T_shirts', 'T_shirt', 'T-shirt', 'Jeans', 'Jean', 'Formal Shirt' 'Shirt']
在這裏,在product_type_list的產品類型的字符串列表有對T恤和每個牛仔褲和襯衫3重複條目2 。
現在我想我的Product_type_list是這樣
Product_type_list=['T_shirt' , 'Jeans', 'Shirt']
我覺得可以用Difflib.Sequencematcher的速動比率。但如何做到這一點
感謝您的回答,但我對Fts匹配邏輯沒有任何認識。你能給我提供一些鏈接,我可以得到知識 –
雅,正如已經說過的,我在SQL Server中的工作就像一個任務。找到這個鏈接它可能會給出一些FTS等級和soundex邏輯。 http://msdn.microsoft.com/en-us/library/cc879245.aspx,http://msdn.microsoft.com/en-us/library/ms187384.aspx –