1
我正在爲UTF-8編碼的XML文件編寫XSD,它可能包含許多非ASCII英文的語言。使用XML Schema驗證語言
有沒有可能的方法來驗證只有某些語言(特別是不使用英文字母,如希伯來語或阿拉伯語的語言)才能通過驗證?
我正在爲UTF-8編碼的XML文件編寫XSD,它可能包含許多非ASCII英文的語言。使用XML Schema驗證語言
有沒有可能的方法來驗證只有某些語言(特別是不使用英文字母,如希伯來語或阿拉伯語的語言)才能通過驗證?
您可以使用正則表達式的模式方面來控制哪些字符集可能會出現,例如
<xs:pattern value="\p{IsHebrew}*"/>
,但我不知道你將如何利用這一點在實踐中:大多數語言中允許使用外國腳本例如當提到外國人的名字時。
請注意區分字符集與編碼。他們是完全不同的概念。像這樣的圖案面說明可能出現的字符,它不限制它們如何被編碼。