我有一些醜陋的字符串類似以下:Python:字符串中有多少個相似的單詞?
string1 = 'Fantini, Rauch, C.Straus, Priuli, Bertali: 'Festival Mass at the Imperial Court of Vienna, 1648' (Yorkshire Bach Choir & Baroque Soloists + Baroque Brass of London/Seymour)'
string2 = 'Vinci, Leonardo {c.1690-1730}: Arias from Semiramide Riconosciuta, Didone Abbandonata, La Caduta dei Decemviri, Lo Cecato Fauzo, La Festa de Bacco, Catone in Utica. (Maria Angeles Peters sop. w.M.Carraro conducting)'
我想一個庫或算法,這將使我的,他們有多少的話有共同的一個百分比,而不含特殊字符,如','
和':'
和'''
和'{'
等。
我知道Levenshtein algorithm。然而,這比較類似性狀的數字,而我想比較,他們有多少WORDS有共同
Levenshtein算法適用於任何2個可比對象序列......另一種放置方法:只要定義了[a [i] == b [j]'並且有意義。 – 2010-08-25 03:52:28