你能指點我的工具將日文字符轉換爲unicode嗎?如何在日語中將日文字符轉換爲unicode?
回答
CPAN給我「Unicode::Japanese」。希望這有助於開始。你也可以看Character Encodings in Perl和perl文檔的文章unicode瞭解更多信息。
s/artical/article/ – 2010-05-18 15:50:37
布拉德,你有編輯權力。 :) – 2010-05-18 22:58:09
爲什麼 - 是嗎?這是唯一的錯誤:)。 – Space 2010-05-20 04:57:17
use Encode qw(decode encode);
my $bytes_in_sjis_encoding = "\x88\xea\x93\xf1\x8e\x4f";
my $unicode_string = decode('Shift_JIS', $bytes_in_sjis_encoding); # returns 一二三
my $bytes_in_utf8_encoding = encode('UTF-8', $unicode_string); # returns "\xe4\xb8\x80\xe4\xba\x8c\xe4\xb8\x89"
對於命令行批量轉換,使用piconv:
piconv -f Shift_JIS -t UTF-8 <infile> outfile
首先,你需要找出源文本的編碼,如果你不知道它了。
日本最常見的編碼是:
euc-jp
:(常用於Unix系統和一些網頁等比shift-jis
更大Kanji報道)shift-jis
(微軟還增加了一些擴展,按住Shift JIS被稱爲cp932
,這是經常使用的非Unicode Windows程序)iso-2022-jp
是一個遙遠的第三
許多語言的通用編碼轉換庫是iconv
(請參閱http://en.wikipedia.org/wiki/Iconv和http://search.cpan.org/~mpiotr/Text-Iconv-1.7/Iconv.pm),它支持many other encodings以及日語。
這個問題對我來說似乎有點含糊,我不確定你在問什麼。通常你會用這樣的東西:
open my $file, "<:encoding(cp-932)", "JapaneseFile.txt"
打開日文字符的文件。然後Perl會自動將其轉換爲內部的Unicode格式。
- 1. 如何將印度語字符轉換爲Unicode轉義字符
- 2. django unicode轉換爲日文
- 3. Cocoa/Objective C:使用日語Unicode字符將數字轉換爲字符串
- 4. 將Unicode轉換爲字符
- 5. 如何將包含unicode字符的字符串轉換爲unicode?
- 6. 使用Libreoffice將任何文件轉換爲pdf時,它將日文(Unicode)字符轉換爲括號
- 7. 如何從文本文件中將字符串轉換爲unicode?
- 8. 將字符串轉換爲日期並將日期轉換回字符串
- 9. 如何將日期字符串轉換爲sql日期格式
- 10. 如何將字符串日期轉換爲日期javascript?
- 11. 如何將日期轉換爲字符串並再次日期?
- 12. 如何將字符串日期轉換爲日期類對象
- 13. 將日誌條目轉換爲UniCode
- 14. 如何將Unicode轉義序列轉換爲.NET字符串中的Unicode字符?
- 15. 在MySQL查詢中將日期字符串轉換爲日期
- 16. 如何在Python中將unicode字符串轉換爲文字字符串?
- 17. 如何在.NET中將字符串轉換爲日期時間?
- 18. 如何在SAS中將字符串轉換爲日期?
- 19. 如何在MySQL中將2個字符串轉換爲日期
- 20. 如何將字符串轉換爲日期在java中
- 21. 如何在java中將字符串轉換爲日期
- 22. 如何在mysql中將字符串轉換爲日期?
- 23. 在MySQL中,如何將此字符串轉換爲日期?
- 24. 如何在PHP中將字符串轉換爲日期?
- 25. 如何在PHP中將日期轉換爲字符串?
- 26. 在PHP中,如何將字符串轉換爲日期?
- 27. 在Unicode中將unicode字符串轉換爲可用的unicode
- 28. 如何將字符串轉換爲Perl中的unicode字符串
- 29. 如何將unicode字符轉換爲java中的實際字符?
- 30. 如何將Unicode字符轉換爲Java中正確的語言字符?
你是指從亞洲字符集。您需要先了解日語的哪種字符編碼,然後才能做到這一點。 – 2010-05-18 08:51:22