2
我想使用Lua在文件中搜索Unicode whitespace chars。對於ASCII,我們可以使用%s
,但是我沒有找到任何在Unicode文件中搜索空白字符的內容。如何在Lua中搜索Unicode空白字符
我想使用Lua在文件中搜索Unicode whitespace chars。對於ASCII,我們可以使用%s
,但是我沒有找到任何在Unicode文件中搜索空白字符的內容。如何在Lua中搜索Unicode空白字符
Lua 5.2及更早版本對Unicode的支持很少。
(upcomming)Lua 5.3提供了一個基本的UTF-8庫。但是,它仍然不知道字符的含義(如什麼是空格字符)。您需要在使用utf8.codes
迭代每個代碼點後自己完成這一部分。
--table to be filled
local whitespace = {0x9, 0xA, 0xB, 0xC, 0xD, 0x20, 0x85, 0xA0, 0x1680, 0x2000, 0x2001}
local str = 'hello\u{2000}world\n'
for _, c in utf8.codes(str) do
for _, v in ipairs(whitespace) do
if c == v then
print 'whitespace found'
end
end
end
Lua 5.1及更早版本不支持unicode字符。 – hjpotter92
@ hjpotter92難道看到的東西有點過於消極嗎?存儲/ concatenatin /轉發工作很好,其他一切都可以建立,但不是內置的。 – Deduplicator