我對Python有點新鮮。我需要從一個文件(A)讀取一些文本,將它與另一個文件(B)的文本進行比較,更改前面提到的文件的一部分並將其寫入第三個文件(C)。問題是A和B文件文件有不尋常的符號,涉及這個符號「¶」。如何處理以下符號:¶
所以,我設法通過下列方式讀取(或寫入)來繞過它(忽略):
input = codecs.open('bla.txt', 'r', 'ascii', 'ignore');
但它並不好。我需要以精確的方式讀取它並進行比較並寫入成功。
所以,我的B檔的內容爲:"Sugar=[[email protected]¶Cherry]"
但是當我讀它,我的變量的值Sugar=[[email protected]¶Cherry]
你可以看到,有更多的「A」
然後我的一個文件包含了很多文本需要複製到C文件中,除了在B中的上述文本之後的特定部分之外。該部分需要更改然後寫入,但它們不相同,我的程序從未進入IF條件其中我正在比較形式A的"Sugar=[[email protected]¶Cherry]"
和來自B的"Sugar=[[email protected]¶Cherry]"
.
有沒有一種方法可以讀取t他的文字使這個符號「¶」出現,因爲它是?
我的標準建議適用:閱讀[(!沒有藉口)絕對最低每一個軟件開發人員絕對,積極必須知道的關於Unicode和字符集(http://joelonsoftware.com/articles/Unicode.html) Joel Spolsky,[Python Unicode HOWTO](http://docs.python.org/2/howto/unicode.html)和[Pragmatic Unicode](http://nedbatchelder.com/text/unipain.html)由Ned Batchelder在你繼續之前。然後以UTF-8格式打開文件並解碼爲Unicode值。 –
我的sys.stdin.encoding是cp1252 – Krcevina
Hoa,我的問題是編碼文件A和文件B之間的差異。一個是UTF-8,另一個是ascii,這是不理想的讀取的原因。感謝這些建議,它們對於像我這樣的人非常有用。乾杯! – Krcevina