2014-01-19 64 views
1

我正在爲UTF-8編碼的XML文件編寫XSD,它可能包含許多非ASCII英文的語言。使用XML Schema驗證語言

有沒有可能的方法來驗證只有某些語言(特別是不使用英文字母,如希伯來語或阿拉伯語的語言)才能通過驗證?

回答

1

您可以使用正則表達式的模式方面來控制哪些字符集可能會出現,例如

<xs:pattern value="\p{IsHebrew}*"/> 

,但我不知道你將如何利用這一點在實踐中:大多數語言中允許使用外國腳本例如當提到外國人的名字時。

請注意區分字符集與編碼。他們是完全不同的概念。像這樣的圖案面說明可能出現的字符,它不限制它們如何被編碼。