1
我對Python很陌生。我試圖從格式的文本文件中提取數據:如何刪除Python中輸出文件中的重複條目?
85729塊尋址指數近似的文字檢索
85730基於自動查詢擴展發散 等等
輸出文本文件是一個單詞的列表,但沒有重複的條目。輸入的文本文件可能有重複。輸出將是這樣的:
塊
解決
指數
近似
等....
我的代碼,到目前爲止,我能獲取單詞列表,但包含重複項。在輸入文件到輸出文件之前,我嘗試檢查是否有重複項,但輸出結果沒有反映出來。有什麼建議麼?我的代碼:
infile = open("paper.txt", 'r')
outfile = open("vocab.txt", 'r+a')
lines = infile.readlines()
for i in lines:
thisline = i.split()
for word in thisline:
digit = word.isdigit()
found = False
for line in outfile:
if word in line:
found = True
break
if (digit == False) and (found == False):
outfile.write(word);
outfile.write("\n");
我不明白如何在Python中關閉循環。在C++或Java中,花括號可以用來定義for循環的主體,但我不確定它是如何在Python中完成的。誰能幫忙?
更多空白:http://stromberg.dnsalias.org/~strombrg/significant-whitespace.html – dstromberg
謝謝!這工作。我現在理解空格python格式。 – user2951046