fuzzywuzzy

    1熱度

    2回答

    我正在使用FuzzyWuzzy String Matching module from SeatGeek。 我發現當使用token_set_ratio搜索算法時,案例中的小差異會給出非常不同的結果。 例如,如果我在文件中查找「我正在吃東西」這個短語,我會得到100%的匹配。但是如果這句話是「我正在吃東西」,只是一個字母的變化,給我一個65%的比賽。 有什麼辦法讓算法不區分大小寫?

    3熱度

    1回答

    請原諒我我是一個新手。我試圖使用seatgeek中的fuzzywuzzy模塊。我使用Python 3 起初,我收到此錯誤: from fuzzywuzzy import fuzz ImportError: cannot import name fuzz 我改變了import語句導入fuzzywuzzy.fuzz和現在,我得到這個錯誤: File "test.py", line 4, in <

    1熱度

    1回答

    我是第一次在這裏發佈的新手程序員。任何建議或意見,將不勝感激!我正在開發一個項目,將test.csv的內容與ref.csv(包含3-4個字的字符串的單個列)進行比較,並根據它與最相似的test.csv中的每個字符串分配一個分數字符串在ref.csv中。我使用fuzzywuzzy字符串匹配模塊來分配相似性分數。 下面的代碼片斷接受兩個輸入文件,將它們轉換成數組,並打印出數組: import csv

    0熱度

    1回答

    我真的不知道如何安裝帶有代碼的庫。我試着在IPython的筆記本電腦與模塊畫中畫intall fuzzywuzzy但我得到一個錯誤信息:正確 In [45]: import pip $ pip install fuzzywuzzy==0.3.1 File "<ipython-input-45-579762da5e80>", line 3 $ pip install f

    0熱度

    1回答

    我已經安裝fuzzywuzzy通過pip安裝到虛擬環境中[fuzzywuzzy == 0.3.1]。 在Python解釋器(通過IPython中)我下面 from fuzzywuzzy import fuzz from fuzzywuzzy import process a = "my name is lena" b = "my name is Elena" fuzz.ratio(a,

    4熱度

    4回答

    我對Python很陌生,但我認爲製作一個程序來分類我所有的下載會很有趣,但是我遇到了一些麻煩。如果我的目的地只有一個單詞,但是如果目的地有兩個單詞或更多,這就是它出錯的地方,程序會陷入一個循環中,這很好。有沒有人比我更好地比較列表 >>>for i in dstdir: >>> print i.split() ['CALIFORNICATION'] ['THAT', "'70S", 'SH