我想要做的是解析原始自然文本並找到描述日期的所有短語。 我有一個相當大的語料庫與所有引用標記的日期: I met him <date>yesterday</date>.
Roger Zelazny was born <date>in 1937</date>
He'll have a hell of a hangover <date>tomorrow morning</date>
我不想解釋
.NET類庫中是否有一種方法可以對字符串進行編碼,以便將存在命名實體的任何字符替換爲使用此命名實體? HttpUtility.HtmlEncode似乎沒有幫助: // Result is "$", would like "€" instead
var encoded = HttpUtility.HtmlEncode("€");