我有5個班,以檢查文件是否屬於一類在python
即:
earn
acq
money
fx
crude
我有大約20000的文件, 列表和我有一個文件「主題。 TXT」,即具有以下形式:
earn~6~7~4
grain~9~1~2~12
money~4~29
等.. 其中數字對應於文件名,和詞對應的類。
我需要打印所有隻屬於我之前提到的類的文件, 「賺」, 「ACQ」, 「金錢」, 「FX」 和 「原油」
EX輸出: (賺-6.txt,7.txt,4.txt)
(ACQ-5 .TXT)
等..
我能打印在「topics.txt」所有可用的類,但我要打印僅5分特定的人。
import collections
import sys
sys.stdout=open('dicti1.txt','w')
with open('topics.txt') as f:
d = collections.defaultdict(list)
for line in f:
value, *keys = line.strip().split('~')
for key in filter(None, keys):
d[key].append(value+".txt")
for i in d.items():
print(i)
你說的「下只,我以前提到的類」是什麼意思?不打印也有其他標籤的文件? –
標籤下的文件:賺,acq,錢,外匯,原油 –