我的電腦上的應用程序需要讀取文本文件。我有幾個,一個不工作;該程序沒有閱讀它,並告訴我,它有一個壞字符在某處。我的第一個猜測是,在那裏有一個非ASCII字符,但我不知道如何找到它。 Perl或任何通用的正則表達式都不錯。有任何想法嗎?搜索非ASCII文檔
13
A
回答
12
4
perl -wne 'printf "byte %02X in line $.\n", ord $& while s/[^\t\n\x20-\x7E]//;'
會發現每一個字符不是一個ASCII字符glyphic,製表符,空格,或換行。
如果它在O.K.的文件中報告0D
s(回車),則將\t\n
更改爲\t\n\r
。
如果它只報告0D
在壞的文件中,那麼您可以通過在它們上運行dos2unix
來修復這些文件。
+0
只是附錄,應該將輸入作爲最終未列出的參數。 – 2014-02-19 22:03:34
+0
就像那樣,謝謝!我不得不在DOS控制檯上稍微改變它: 'perl -wne「printf qq(字節%02X在$。\ n中),ord $&while s/[^ \ t \ n \ x20- \ x7E]//;」
2
如果您在源代碼中使用製表爲好,試試這個模式:
[^\x08-\x7E]
作品也在記事本++
相關問題
- 1. 學說可用非ASCII字符搜索
- 2. 搜索文檔
- 3. 搜索XML文檔
- 4. 搜索XML文檔
- 5. 如何搜索非ASCII字母的文本
- 6. NHibernate全文搜索文檔
- 7. Marklogic PDF文檔搜索
- 8. 像文檔搜索頁面
- 9. Nhibernate搜索文檔編號
- 10. DOM文檔搜索標籤
- 11. 搜索python文檔脫機?
- 12. 正在搜索Riscv文檔
- 13. 文檔搜索,Xapian的
- 14. Mac終端文檔搜索
- 15. RoR中的文檔搜索
- 16. 在大文檔中搜索
- 17. MongoDB嵌套文檔搜索
- 18. 在XML文檔中搜索
- 19. MongoDB - 搜索子文檔
- 20. 搜索文檔的ObjectId:pymongo
- 21. 搜索兩個Lucene文檔
- 22. 如何在Vim中使用正則表達式搜索字母(ascii和非ascii)?
- 23. 搜索A文檔庫或文檔在Sharepoint文檔庫中
- 24. 搜索和檢索在線文檔
- 25. Solr不搜索整個索引文檔
- 26. 索引和搜索XML文檔
- 27. 使用Cloudera索引PDF文檔搜索
- 28. 搜索包含非ASCII字符的Python模塊
- 29. Lucene不搜索完整的非ASCII字符
- 30. Solr的搜索與非標準ASCII字符
那你試試這麼遠嗎? – nmagerko 2012-01-13 02:59:52
我相信你可以找到一個答案[這裏](http://stackoverflow.com/questions/881931/how-can-i-find-extended-ascii-characters-in-a-file-using-perl)? – Neilos 2012-01-13 03:11:36
我接受了數學咖啡,因爲它超強 - 在記事本++中工作 – 2012-01-13 19:24:19