我試圖找出一個特定的詞,然後數它。我需要保存每個標識符的計數。如何搜索,計數和保存單詞?
例如,
風險風險風險利率
星號風險風險
市場風險風險[風險
*文檔中包含上述,我需要的話計算'風險'不是星號。我還需要把[風險視爲'風險')。這是我到目前爲止。但是,它會返回星號和[風險以及風險。我不需要爲星號計數,但僅用於風險,包括[風險。我試圖使用正則表達式,但不斷收到錯誤。另外,我是Python的初學者。如果有人有任何想法,請幫助我!^^謝謝。
from collections import defaultdict
word_dict = defaultdict(int)
for line in mylist:
words = line.lower().split()
for word in words:
word_dict[word]+=1
for word in word_dict:
if 'risk' in word:
word, word_dict[word]