2013-12-18 29 views
0

我有一個內容數據庫,其中大多數是HTML頁面,然後用於顯示應用程序。我如何搜索HTML中的內容而不是標籤

我們正在尋求建立一個搜索功能,但我對由於包括HTML代碼在內的結果而出現的誤報有一些擔憂。

E.g搜索「標題」將返回具有

目前,我們正在使用NSPredicates執行核心數據數據庫查詢標題HTML標記的任何內容的網頁。

有沒有簡單/有效的方法來防止返回這些結果?

我在Windows和Android上也有同樣的問題!

+0

http://stackoverflow.com/questions/240546/removing-html-from-a-java-string – dymmeh

回答

1

iOS的一個想法是實際存儲除HTML版本以外的單獨文本版本。然後,您可以用很簡單的(即使不是很有效)謂詞躺在

[NSPredicate predicateWithFormat:@"text CONTAINS[cd] %@", searchText]; 

更高性能的方法是將剝離出來的話和他們小寫存儲在另一個實體的索引屬性。

在這兩種情況下,解析都應事先通過其中一個可用庫進行(請參閱,例如,評論中的鏈接)。

相關問題