1
如果我有一些包含短語「1:1」的文本。我如何獲得CountVectorizer
將其識別爲令牌?獲取CountVectorizer以包含「1:1」
text = ["first ques # 1:1 on stackoverflow", "please help"]
vec = CountVectorizer()
vec.fit_transform(text)
vec.get_feature_names()
呀,什麼的ΔRemÿ選擇,如果我的文字有標點符號? – Huey