輸入的內容是HTML從webkit的窗口複製的塊,像Perl的就地編輯弄亂文本編碼
它使用UTF-8正確地顯示在webkit的。
我想要做的是,以取代所有的標籤,我用這一個班輪:
perl -i -pe "s/<img.+?>//g"
輸入是我複製到我的剪貼板,然後由另一程序重定向到這一個班輪的富文本,大概是這樣的:
echo "rich html text" | perl -i -pe "s/<img.+?>//g"
那麼,它去掉<img>
標籤,但所有的Unicode字符替換得到損壞後。
我在Windows 7上,區域en - 美國。 cmd代碼頁已被設置爲UTF-8。 即使通過-C
選項,它也不起作用。
有沒有辦法讓代碼保持一行,同時使它爲Unicode輸入工作?
http://stackoverflow.com/q/627661/725418 – TLP
而不是perl,輸出到標準輸出或文件,以確保這不是你的第一個程序,它首先混淆了內容。 –