2012-09-17 34 views
1
import pdb 
input_file_eng = open('engltreaty.txt') 
word_list_eng = input_file_eng.read() 
pure_word_list_eng = word_list_eng.strip("\n").strip("\r").strip('-').strip('.').strip(',').strip('(').strip(')').strip('[').strip(']') 
pdb.set_trace() 
input_file_eng.close() 

,並在破發點,我檢查字符串pure_word_list_eng,它仍包含「[」,「]」,「\ N」‘\ n \ n’個爲什麼不剝離在python方法採取兩個「 n」個文本文件

和下面我爲文本文件:

女皇陛下VICTORIA英國大不列顛女王和 愛爾蘭公主關於青睞本土酋長和部落新西蘭的 ,並急於保護他們的正義權利和財產 ,並確保em享受和平與良好秩序已被視爲 由於女王陛下衆多, 已經在新西蘭定居的受試者以及來自歐洲和澳大利亞的移民局的快速 延期,該延期仍在進行中,其中 正在進行中構成並任命一位職務適當的 被授權與新西蘭原住民對待, 承認女皇陛下對整個或任何這些島嶼的任何部分的主權權利 - 因此,女王陛下希望建立一個定居的公民政府形式的 以期避免由於缺乏必要的法律和機構而導致的惡果。當地居民和她的受訪者一直很高興授權並授權我威脅霍布森女王陛下的英國皇家海軍領事和 新西蘭的這些地區的副州長或可能是 此後將被割讓給陛下邀請邦聯和新西蘭獨立酋長同意以下條款 和條件。

條第一[第1條]新西蘭 聯合部落聯合會和院長的單獨和獨立的酋長 誰沒有成爲聯盟的成員割讓給英國女王陛下 英國女王絕對和毫無保留地保留所有權利 以及所述聯邦或個人 行政長官分別行使或擁有或可能認爲是 行使或擁有作爲其唯一 主權的主權的權力。

條第二第二條女王陛下英格蘭 確認和保障的酋長和新西蘭各自的家庭和個人及其全獨家 不受干擾擁有自己的土地和莊園的和 部落森林漁業 以及他們可以共同或單獨地擁有的其他財產 只要他們希望並希望保留它們所擁有的 ;但聯合部落酋長和 個別酋長向女王陛下提供 的專有權優先於其所有者的土地可被處置 以 各自所有者和個人之間可能商定的價格由女王陛下代爲與他們對話 。

條第三第三條有鑑於此陛下 女王英國延伸到新西蘭公主 保護當地人,並賦予他們所有的權利和 英籍特權。

(簽名)威廉霍布森,副州長。

現在,因此,我們聯合部落新西蘭 組裝國會在維多利亞懷唐伊和 我們新西蘭的分開和獨立的酋長聲稱 機關在部落和地區,其聯合會的酋長指定後 我們各自的名字,已作出充分了解上述條約的 規定,接受並 飽滿的精神進入同和證人及其意義,而我們有 附上了我們的地方簽名或標記和分別指定日期 。在二月六日在懷唐伊做 我們的主一千八百四十年的一年。

+0

除了接受的答案:注意,條帶( '\ n \ r - , - ()[]')通常比鏈帶的功能更合適(但不是等效) –

回答

5

the docs

返回字符串與開頭和結尾字符的副本中刪除

嘗試用str.replace()代替。

3

正如Ignacio所述,str.strip()僅從字符串的開頭和結尾刪除字符。您應該使用str.replace(),或者這種替代使用正則表達式:

import re 
pure_word_list_eng = re.sub(r'[-\n\r.,()]+', '', word_list_eng) 
+0

+1用於改寫'前面和後面的字符被刪除.'有時我不能立刻找出英文解釋 – mko

4

嘗試str.translate

string.translate(S,表[,deletechars])
刪除從s 是在所有字符(如果存在),然後使用表翻譯 字符,該表必須是256個字符的字符串,爲每個字符值提供 轉換,並按其序號進行索引。如果 表爲無,則僅執行字符刪除步驟。

所以

pure_word_list_eng = word_list_eng.translate(None, "\n\r-.,()[]") 
+0

+1指出'translate'方法,它是選擇替換乘法字符 – mko

相關問題