這個想法是打開一個包含縮寫和完整單詞的文本文件。 與2列和n行一樣的表。 然後打開html文件,去掉html標誌,搜索縮寫,替換它們並將它們保存在新的文本文件中。html文件中的Python替換縮寫
-------------------------應該在文件中打開:
RASPUKNUTI,raspuknutivi
topografskiüslucaju reflektivni ZA svaki .. 。
代碼
import re
from bs4 import BeautifulSoup
import codecs
#--------------------------------unos podataka za pretrazivanje
dat=open('citaj.txt',"r")
bs4_objekt=BeautifulSoup(dat,"lxml",from_encoding="UTF-8")
onlytext=bs4_objekt.text.strip()
#
z=open('zamijeni_kratice3.txt','r')
text=z.read()
lista_rijeci=text.split('\n')
for rijec in lista_rijeci:
odjeli=rijec.split("|")
samotext=re.sub("\s({0})".format(odjeli[0]),"{0}".format(odjeli[1]),onlytext)
#sm2=re.sub(r'\s(refl.)','reflektivni',samotext)
z.close()
with codecs.open('novi_HAZU.txt','w',encoding='utf8') as f:
f.write(sm2)
f.close()
的格式的話是不行的,而且它並不顯示錯誤。當我把替換隻是一個字,工作正常:
#sm2=re.sub(r'\s(refl.)','reflektivni',samotext)
我在這裏循環旋轉。任何建議,想法?
01.02.2016。 19:26 我的目標是得到類似於Python解釋器的東西,而不是目前的狀態文件:picture 或最近的我能到原來的:address
您能給你的變量和文件有意義的英文名字這會讓我們更容易理解你的代碼。順便說一下,我只需用'f.open()'縮寫來打開html文件和文件,遍歷每個縮寫並用'str.replace()'代替它。 – wewa
謝謝你的回覆。我會牢記這一點。 – biGmazi