2012-04-08 109 views
0

我正在開發一個將數據從SharePoint列表讀取到數組中的應用程序。我正在將這些數據作爲文本字段顯示在屏幕上。然而,其中一個導入的數據字段被格式化爲html標記代碼,例如xcode - 從html代碼中提取文本

<div class="ExternalClass7E8EC81DFF944C7BB81DA896086ABDFF"><p> </p>
<div><span style="font-size:12pt"><font face="Calibri">Project Completion Date (A05-A07) <span>  </span><span>  </span>15<sup>th</sup> May 2012</font></span></div>
​ <p> </p></div>

有誰知道我怎麼會去提取這個文本內容?另外也許我應該看看在屏幕上顯示這些數據作爲網頁?如果有的話可以有人指出我在正確的方向嗎?

非常感謝您的幫助...

回答

2

發佈的HTML編碼爲「實體」代碼。所以,第一個任務是解碼這些以回到實際的HTML。你可以使用CFXMLCreateStringByUnescapingEntities()

您可以使用NSXMLDocumentTidyHTML選項從結果創建NSXMLDocument。您可以請求-stringValue以獲取純文本。

或者,您可以創建一個帶有-initWithHTML:documentAttributes:的NSAttributedString。

+0

謝謝。我已決定使用'loadHTMLString'作爲網頁路徑。我已經將前面提到的數據傳遞給了一個新的視圖,但它顯示爲html而不是作爲網頁呈現。任何線索我如何從這一點正確渲染它?謝謝。 – 2012-04-09 13:15:23

+0

好吧,我終於對它進行了排序 - 使用MREntitiesConverter來解碼HTML以移除實體,然後loadHTMLString將純HTML代碼呈現在屏幕上作爲網頁。 – 2012-04-09 14:20:51