我想通過用一個字符替換重複的字符來規格化阿拉伯文字符串。例如:單詞 رااااائع
將被標準化爲 رائع
我找到了適合英語(Python)的正則表達式: s="I loooooooooooooooooove you"
s = re.sub(r'(.)\1+', r'\1', s) // s= "I love you"
但是,這個正則表達式不起作用阿拉伯文字符串。我不認識這個事業。
我正在做一個簡單的函數,應該從阿拉伯文字刪除tashkeel,替換技術適用於英文,但不適用於阿拉伯文,你會建議什麼? Lua代碼: - function replacePartOfString(arg,old,new)
local zzz = arg.gsub(arg, old, new)
return zzz
end
function wordLengthIgnorin