我使用python 2.6在Linux上。在一個文件中使用文本搜索賽在第二個文件
我有兩個文本文件 first.txt對每行文本的一個字符串。所以它看起來像
LOREM
議會聯盟
ASFD
第二個文件不相當有相同的格式。 它看起來更像是這個
1231 LOREM
1311 assss 311
等
我想借此從first.txt文本的每一行,並確定是否有在第二個文本匹配。如果沒有匹配,我想將缺失的文本保存到第三個文件。我想忽略情況,但並非完全必要。這就是爲什麼我在看正則表達式,但沒有多少運氣。
所以我打開文件,使用readlines方法()來創建一個列表。
遍歷列表並打印出匹配項。
這裏是我的代碼
first_file=open('first.txt', "r")
first=first_file.readlines()
first_file.close()
second_file=open('second.txt',"r")
second=second_file.readlines()
second_file.close()
while i < len(first):
j=search[i]
while k < len(second):
m=compare[k]
if not j.find(m):
print m
i=i+1
k=k+1
exit()
這絕對不是優雅。任何人都有建議如何解決這個問題或更好的解決方案?
lorem`是否也匹配`somelorem`?整條線是否應該完全相同?應該只有單詞是相同的? – Wolph 2011-02-13 06:05:29