尋找一些從未使用Unicode字符 - 一些象徵 - 並使用NSString的空格字符更改爲別的東西,然後提取你想要什麼,以及做琴絃反向編碼。
編輯:因此,可以說你的網頁作爲一個NSData對象:
NSString *str = [[NSString alloc] initWithData:myData encoding:NSUTF8StringEncoding];
NSString *nStr = [str stringByReplacingOccurrencesOfString:@"\uC2A0" withString:@"\u2208"];
NSData *nData = [[nStr ]dataUsingEncoding:NSUTF8StringEncoding];
// do your parsing
// for each parsed string
NSString *nStr = [str stringByReplacingOccurrencesOfString:@"\u2208" withString: @"\uC2A0"];
這將在年底得到您確切的輸入字符串。但是,也許你只是想忘掉那些Unicode的空間,只是把它們變成現實空間:
NSString *nStr = [str stringByReplacingOccurrencesOfString:@"\u2208" withString: @" "];
NSString *str = [[NSString alloc] initWithData:myData encoding:NSUTF8StringEncoding];
NSString *nStr = [str stringByReplacingOccurrencesOfString:@"\uC2A0" withString:@"\u2208"];
NSData *nData = [[nStr ]dataUsingEncoding:NSUTF8StringEncoding];
你甚至可以找雙空間,並與一個單一的一個替換它們。
這是HTML或XML?周圍是什麼文字?標籤?引號?你有在文件中定義的DTD嗎? –
它的XML與被標記包圍的文本。 – Gruntcakes
DTD在頂部?喜歡的東西: –