1
這裏是谷歌驅動器上的測試文件。如何用awk列出所有非ASCII字節?
我想列出所有與測試文件的awk字節非ASCII字節,這超出\ x00- \ 0x7F部分。
\ x00- \ x7f之後有12個字節。
這是我的嘗試。
awk 'BEGIN{FS=""}{for(i=1;i<=NF;++i)if($i~/[^\x00-\x7f]/)print i,$i}' test
146 「
148 」
181 「
184 」
awk 'BEGIN{FS=""}{for(i=1;i<=NF;++i)if($i~/[^\x00-\x7f]/)printf("%d %x \n", i,$i)}' test
146 0
148 0
181 0
184 0
失敗,如何列出文件中的所有12個字節,如下格式。
146 e2
147 80
148 9c
150 e2
151 80
152 9d
185 e2
186 80
187 9c
190 e2
191 80
192 9d
export LC_ALL=C
awk 'BEGIN{FS=""}{for(i=1;i<=NF;++i)if($i~/[^\x00-\x7f]/)printf("%d %c\n",i,$i)}' test
146
147 �
148 �
150
151 �
152 �
185
186 �
187 �
190
191 �
192 �
如何修復我的代碼?
我想說,你忘記了2「非ascii」在你的照片組之前的2'e2'。 –
2 ** e2 **已添加。 –