我正在處理清理相對較大(30行)的文本塊。下面是摘錄:用Python替換大字符串中字符的最佳方法?
PID | 1名|| 06225401 ^^^ PA0^MR ||患者^ FAKE [R |||˚F
PV1 | 1 |我||||| 025631^DoctorZ ^^^^^^^ PA0 ^^^^ DRH | DRH |||| ...
ORC | RE || CYT-09-06645^AP |||||| 200912110333 | INTERFACE07
OBR | 1 || CYT09-06645 | 8104 ^^ |||大號20090602 ||||||| 200906030000 [conditio ...
OBX | 1 | TX | 8104 | 1 |作者 的源PECIMEN:[來源] ||||||˚F||| 200912110333 | CYT ...
我現在有一個腳本,它非法字符或條款。這是一個例子。
infile = open(thisFile,'r')
m = infile.read()
#remove junk headers
m = m.replace("4þPATHþ", "")
m = m.replace("10þALLþ", "")
我的目標是修改此腳本,以便我可以將4位數字添加到其中一個字段的末尾。具體而言,OBR行中的日期字段(「20090602」)。完成的腳本將能夠處理任何遵循相同格式的文件。這可能與我目前處理文件輸入的方式,還是我必須使用一些不同的邏輯?
這個問題並不完全清楚。你能提供樣本輸入和輸出嗎? – 2009-08-07 00:22:30
那些垃圾頭可以更好地表達爲例如「4 \ xfePATH \ xfe」可以很簡單地表明所謂的「非法字符」不是字符(既不是冰島小寫字母也不是拉丁文小寫字母p(這是乍看之下的樣子)),而是二進制垃圾。 – 2009-08-07 01:03:08