2010-12-04 25 views
0

我的應用程序正在成功從Twitter搜索API中使用JSON。但是,我對我應該如何處理內容感到困惑。每個Tweet JSON對象都有一個「文本」屬性,所以我認爲它應該被視爲這樣。不過,我看到很多",&amp等內容中的廢話。Twitter搜索API:Tweet文本應該包含XML還是HTML?

Twitter API是不是很糟糕,是通過它的XML錯誤地編碼文本內容,或者Twitter API的用戶應該以某種方式將Tweet文本處理爲純文本以外的內容?我意識到有一個標記約定,例如@username指示與其他Twitter用戶的通信,並且http://指示鏈接。我們是否也應該期待XML或HTML實體?顯然,我不想僅僅將Tweet文本作爲HTML插入。

回答

0

文本字段返回的文本不是html既不是xml,但在文本中它使用特殊的html字符的東西,如" tjat是引號(因爲它不能將它們包括在json中,而不會造成混亂),它也增加來自外語的特殊字符,比如「2011 \ u5e746 \ u6708 \ u767a \ u」,所以不要驚訝地發現這個東西。只需要瞭解最常見的marquer,以便在您想要對文本進行操作時替換它們。

+0

感謝您的回答。你知道他們的特殊編碼是否記錄在任何地方?我期望`\ u ####`東西,因爲這是JSON標準的一部分,但我不確定我應該尋找哪些特定的HTML實體(雙引號應該用反斜槓,並沒有理由爲什麼`&`需要被轉義)。 – Jacob 2010-12-06 18:18:30

相關問題